Un nuevo capítulo se abre en el mundo de la inteligencia artificial, donde las empresas tecnológicas están recurriendo a un tesoro inesperado: las bibliotecas. En un esfuerzo por enseñar a las máquinas sobre la humanidad, gigantes de la tecnología están explorando las estanterías llenas de libros, algunos tan antiguos como del siglo XV, para alimentar sus sistemas con un conocimiento más profundo y diverso.
La Universidad de Harvard ha dado un paso monumental al compartir una colección de casi un millón de libros en 254 idiomas con investigadores. Esta iniciativa no solo incluye textos modernos, sino también obras centenarias que ofrecen una perspectiva única sobre la historia, la cultura y el pensamiento humano. Pronto, la Biblioteca Pública de Boston se unirá a este esfuerzo, añadiendo periódicos antiguos y documentos gubernamentales a la base de datos.
El objetivo es claro: enriquecer los modelos de inteligencia artificial con información que va más allá de los datos superficiales de internet. Las bibliotecas, guardianas de siglos de conocimiento, ofrecen un repositorio cultural e histórico que los comentarios en línea no pueden igualar. Este enfoque busca dotar a los sistemas de IA con una comprensión más completa de la humanidad.
Sin embargo, esta carrera por datos no está exenta de controversias. Empresas como Meta y OpenAI enfrentan demandas de autores y artistas que acusan a estas compañías de usar sus obras sin permiso para entrenar chatbots. Novelistas y creadores visuales han alzado la voz, exigiendo que se respete su propiedad intelectual en este nuevo escenario tecnológico.
La Iniciativa de Datos Institucionales de Harvard, respaldada por donaciones de Microsoft y OpenAI, está trabajando con bibliotecas y museos de todo el mundo. Su misión es preparar estas colecciones históricas para su uso en inteligencia artificial, asegurando que las comunidades también se beneficien. Este esfuerzo busca equilibrar el poder, devolviendo a las instituciones culturales un rol central en la era digital.
Aristana Scourtas, líder de investigación en el Laboratorio de Innovación de Bibliotecas de Harvard, destaca la importancia de este cambio. Según ella, las bibliotecas no solo ofrecen datos, sino también una oportunidad para empoderar a las comunidades locales frente al dominio de las grandes tecnológicas. Es un intento por democratizar el acceso al conocimiento en la era de la IA.
La colección de Harvard para entrenar inteligencia artificial contiene aproximadamente 242 mil millones de tokens, una cifra que, aunque enorme, es solo una fracción de los datos que manejan los modelos más avanzados. Por ejemplo, Meta ha utilizado más de 30 billones de tokens de texto, imágenes y videos para entrenar su última versión de inteligencia artificial, lo que resalta la escala de esta carrera tecnológica.
OpenAI, por su parte, ha invertido 50 millones de dólares en instituciones como la Biblioteca Bodleian de Oxford, que está digitalizando libros raros. Este proceso incluye el uso de inteligencia artificial para transcribir textos antiguos, abriendo nuevas posibilidades para preservar y compartir el patrimonio cultural de la humanidad.
A medida que las bibliotecas reales imponen sus condiciones, se abre un debate sobre cómo equilibrar la innovación tecnológica con los derechos de los creadores. La digitalización de estos acervos no solo beneficia a las empresas, sino que también permite a investigadores y al público acceder a un conocimiento que antes estaba reservado a unos pocos.
Este avance marca un momento emocionante para la inteligencia artificial y las bibliotecas. La colaboración entre tecnología y cultura promete transformar nuestra comprensión del pasado y moldear el futuro de las máquinas con un toque más humano.

Imagen generada por IA con fines informativos o representativos. Digital Plural se deslinda de cualquier uso o interpretación.
La inteligencia artificial revoluciona el acceso al conocimiento en las bibliotecas de Estados Unidos
Compartir: