Versión de nota de César López Linares para LatAm Journalism Review
La inteligencia artificial (IA) está transformando el panorama del periodismo, desde la forma en que se recopilan datos hasta cómo se presentan las noticias. Modelos de predicción que anticipan tendencias, redes neuronales que optimizan procesos y técnicas avanzadas que mejoran la interacción con audiencias son solo algunos ejemplos de cómo la IA está moldeando el futuro de las redacciones.
Sin embargo, esta revolución tecnológica plantea retos significativos, ya que muchos periodistas y medios todavía no están familiarizados con los conceptos más complejos de esta disciplina. En este artículo, exploramos 10 términos avanzados de IA y cómo están siendo utilizados para mejorar la precisión, eficiencia y alcance del periodismo.
- Entidad
Una entidad es una unidad de información procesada por sistemas de IA, que puede representar desde nombres y eventos hasta conceptos abstractos. Estas son fundamentales para estructurar y analizar datos no organizados.
Ejemplo: La herramienta TimeLark, desarrollada por la BBC, OCCRP y Reuters, utiliza aprendizaje automático para extraer entidades de artículos no estructurados y visualizar conexiones ocultas entre ellas. En un proyecto piloto, analizó más de 30 mil artículos sobre la guerra en Ucrania, identificando líderes políticos, países y organismos clave.
- Alucinaciones
Las alucinaciones ocurren cuando un modelo de IA genera respuestas incorrectas o incoherentes. Esto puede suceder por falta de datos relevantes o errores al interpretar patrones.
Ejemplo: En 2023, “The New York Times” probó ChatGPT preguntándole sobre el primer artículo del diario relacionado con IA. La herramienta inventó un artículo ficticio de 1956, demostrando los riesgos de confiar en IA generativa sin supervisión rigurosa.
- Text-to-speech
Esta tecnología convierte texto escrito en audio con voz humana sintética mediante algoritmos avanzados como Tacotron o WaveNet.
Ejemplo: Illariy, un avatar creado en Perú, presenta noticias en quechua utilizando tecnologías text-to-speech. Los creadores introdujeron texto fonético en español para que la plataforma emulara palabras en quechua, permitiendo así la difusión de noticias en una lengua indígena.
- Reconocimiento Óptico de Caracteres (OCR)
El OCR convierte texto en imágenes o documentos escaneados en texto editable. Es esencial para digitalizar grandes volúmenes de información.
Ejemplo: Datashare, una herramienta del Consorcio Internacional de Periodistas de Investigación (ICIJ), utilizó OCR para analizar los 11.9 millones de documentos filtrados en los “Pandora Papers”. Esto permitió a los periodistas identificar rápidamente nombres y organizaciones clave.
- Minería de datos
La minería de datos explora grandes conjuntos de información para descubrir patrones y relaciones ocultas mediante aprendizaje automático y estadística.
Ejemplo: Herramientas como RapidMiner han sido fundamentales en investigaciones como los “Panama Papers”. Esta tecnología permitió agrupar documentos según palabras clave, agilizando el análisis de millones de archivos filtrados.
- Análisis predictivo
Esta técnica utiliza datos históricos y modelos matemáticos para prever eventos futuros y optimizar decisiones.
Ejemplo: “The New York Times” empleó análisis predictivo para entender cómo los lectores se convierten en suscriptores. Esto ayudó a diseñar estrategias editoriales y comerciales más efectivas, además de identificar temas que generan mayor interacción en redes sociales.
- Búsqueda semántica
A diferencia de las búsquedas tradicionales, esta técnica comprende el significado e intención detrás de una consulta, ofreciendo resultados más precisos.
Ejemplo: En 2024, el “Financial Times” lanzó AskFT, una herramienta que utiliza búsqueda semántica para responder preguntas complejas de sus usuarios corporativos. Los artículos relevantes son resumidos por un modelo generativo que incluye citas verificadas.
- Reconocimiento de entidades nombradas (NER)
El NER identifica y clasifica entidades como nombres propios, lugares y valores monetarios en textos no estructurados
Ejemplo: DockIns, una herramienta colaborativa entre medios latinoamericanos y estadounidenses, utilizó NER para analizar más de 10 mil documentos del Ministerio de Seguridad argentino. Esto permitió extraer información clave sobre licitaciones y contratos gubernamentales.
- Generación aumentada por recuperación (RAG)*
La técnica RAG combina generación de texto con recuperación de información en tiempo real, reduciendo errores y “alucinaciones” en las respuestas generadas.
Ejemplo: Fátima GPT, un chatbot desarrollado por el medio brasileño Aos Fatos, vincula su modelo generativo a una base de datos confiable compuesta por material periodístico verificado. Esto asegura respuestas basadas en hechos comprobados.
- Prompt design
El diseño de prompts optimiza las instrucciones dadas a modelos de IA para obtener respuestas precisas y relevantes.
Ejemplo: Joe Amditis publicó un manual en 2023 para enseñar a periodistas a diseñar prompts efectivos con herramientas como ChatGPT. Este documento detalla cómo ajustar instrucciones según las necesidades específicas de una redacción.
El Futuro del Periodismo con IA
La integración de estas tecnologías no solo mejora la eficiencia en las redacciones, sino que también abre nuevas posibilidades para investigaciones más profundas y narrativas más personalizadas. Sin embargo, su implementación requiere capacitación constante y un enfoque ético riguroso para evitar la difusión de información errónea.
Así como la imprenta revolucionó el periodismo hace siglos, la inteligencia artificial está marcando el comienzo de una nueva era informativa, donde la colaboración entre humanos y máquinas será clave para enfrentar los desafíos del futuro mediático.