Mapa web
Youtube
Instagram
Campus UNED

Ana García Serrano: " As HD van máis aló do uso de ferramentas informáticas nas humanidades”

23 de abril de 2021

A profesora doutora da UNED disertou esta mañá sobre o procesamento da linguaxe natural en humanidades dixitais, desde o Centro de IA de Ourense, nun seminario que conta co apoio do Vicerreitorado de Investigación, Transferencia do Coñecemento e Divulgación Científica.

OURENSE, 23 de abril de 2021.-Ana García Serrano comezou reflexionando sobre como a intelixencia artificial (IA) pon de moda e durante cada ciclo xera moitas expectativas tanto alcanzadas como de ficción. O termo intelixencia artificial aplícase cando unha máquina imita as funcións cognitivas que os humanos asocian con outras mentes humanas, por exemplo: percibir, razoar, aprender e resolver problemas. “Pero estas funcións humanas realízaas unha máquina de forma moi similar a como un avión voa con respecto a como o fai un ave”, sinala a relatora. Como exemplos do cumprimento de expectativas xeradas polos avances na investigación e desenvolvemento en informática e en concreto na IA, citou aplicacións ben coñecidas socialmente e desenvolvidas con novas tecnoloxías sobre a base das últimas décadas para levarnos a cuestionar a súa potencial utilización nas humanidades dixitais: 

  •  Década dos 80: xeralízanse os computadores persoais e con eles a ofimática, a aplicación das bases de datos para compañías, os programas de cálculo de estruturas para arquitectos e enxeñeiros.
  • Década dos 90: xeneralízase a información na web, os recomendadores de películas ou produtos a partir dos nosos datos e “comportamentos” como usuarios na internet. Desenvólvense aplicacións comerciais complexas como son os sistemas informáticos de deseño para fabricantes de moda, robotización das fábricas e almacéns de stock de produtos; a recolección de pistachos con robots, a xestión de investimentos.
  • Primeira década do século XXI: xeralízanse as redes sociais e o consumo das noticias cambia, dispáranse as compras en liña mediante Amazon, fálase de “San Google” porque todo sábeo. 
  • Segunda década do século XXI: o tradutor de Google acapara parte do mercado, popularízase a televisión de pago ( Netflix), o móbil intelixente desbanca a outros dispositivos e mesmo aos reloxos de boneca, a criptomoneda aumenta a súa presenza nos mercados e empresas como Nomics, lanza predicións baseadas na IA, de prezos a sete días.

Tamén presentou algunhas ideas contrastadas en informes actuais, por exemplo sobre a adopción da IA nas empresas e comentou o interese do regulamento publicado o pasado mércores, 21 de abril, da Comisión Europea, que supón o primeiro marco legal sobre a IA, e que aborda os riscos da IA e posiciona a Europa para desempeñar un papel de liderado a nivel mundial. Na actualidade existen varios informes sobre a adopción da IA: 

  •  Informe 'O Estado de Intelixencia Artificial 2020, elaborado por McKinsey & Company a partir dunha enquisa a 2.395 participantes de distintas rexións, industrias e empresas de todo o mundo, indica que a adopción de Intelixencia Artificial ( IA) non aumentou masivamente en 2020, a pesar de que o 60% das empresas cun alto rendemento do seu investimento en IA aumentase este ano o investimento nesta tecnoloxía. Por outra banda, o 22% das empresas que implementaron algún tipo de AI observa un impacto positivo sobre o seu EBIT (beneficio antes de intereses e impostos).
  •  Informe Microsoft IA en España (2019), a partir de información de 277 empresas, en 7 sectores e 15 países de Europa, conclúe que o 71% das empresas europeas considera que a IA é un tema importante para os directivos e un 57% das compañías espera que a IA teña un alto ou moi alto impacto nas áreas de negocios que son «totalmente descoñecidas para as compañías na actualidade». Só o 4% das empresas está a utilizar activamente a IA en moitos procesos e para permitir tarefas avanzadas. Un 28% das empresas enquisadas atópase na etapa de «lanzamento» na que comezaron un uso activo da IA nun ou uns poucos procesos na empresa. 
  • Informe de Ernst and Young para Microsoft: IA no sector público: Perspectivas europeas para 2020 e anos seguintes (España). O 33% do Sector Público en España xa implementou solucións de Intelixencia Artificial. O seu uso no ámbito público atópase nunha fase inicial no noso país, aínda que o 80% recoñece que a implantación desta tecnoloxía é unha prioridade dixital.
 

A profesora Ana García Serrano explicou tamén que é o procesamento da linguaxe natural, unha sub-área da IA, que pretende simular o coñecemento e comportamento humanos no dominio da linguaxe e a comprensión lingüística. En PLN desenvólvense recursos de información e algoritmos que os xestionan para resolver problemas relacionados coa lingüística e a comprensión da linguaxe, pero tamén coa comunicación intelixente. Neste sentido hai exemplos ben coñecidos: dicionarios dixitais, asistentes como Alexa ou Cortana, tradutores como o de Google (con tecnoloxía de IA que aparece en investigación e #implantar en explotación en menos de tres anos), analizadores sintácticos e morfolóxicos integrados en buscadores como Google, Bing (Microsoft) ou Safari (Apple).

De acordo co Informe SEPLN 2020, a simulación de procesos cognitivos humanos nunha máquina segue sendo imposible porque continúa sen resolverse o problema científico de comprender como funciona o intelecto humano. A relatora destaca que “o PLN, tamén coñecido como lingüística computacional ou as Tecnoloxías da Linguaxe (TL) están no corazón do software que actualmente procesa a información non estruturada e explota a gran cantidade de datos contidos nos textos, tamén os da web, dos medios sociais e das interaccións por voz. Informes de varias consultoras prognostican un gran crecemento do mercado mundial en TL baseándose na explosión de aplicacións observada nos últimos anos e nun crecemento exponencial dos datos dixitais non estruturados. Desenvolver as TLs para o español é clave: o español é a segunda lingua con máis falantes nativos no mundo e a terceira por número de falantes, posición que se mantén nas clasificacións de linguas máis usadas nas redes sociais”.

Outro concepto que explicou García Serrano é o de Humanidades Dixitais (HD). “É unha área de investigación, ensino e creación na que converxen as humanidades e a informática, e incorporan tanto materiais dixitalizados como artefactos orixinados no medio dixital. Para o seu exercicio, combinan as metodoloxías propias das disciplinas humanísticas tradicionais (historia, filosofía, filoloxía, lingüística teórica, lingüística aplicada, historia da arte, arqueoloxía, música e estudos culturais) e das ciencias sociais co uso de ferramentas informáticas. As HD van máis aló do uso de ferramentas informáticas nas humanidades”.

A que nos referimos cando falamos de humanidades dixitais? “O coñecemento humanista e resolución de enigmas históricos pode incrementarse co uso de metodoloxías e técnicas que proveñen da informática, así como as técnicas e os desenvolvementos informáticos nútrense de resultados físicos ou matemáticos”, sinala a relatora. Precisamente no ámbito do Patrimonio cultural produciuse unha evolución desde que en:

  •  2011: aparece a recomendación europea para que en 2025 todo o patrimonio cultural (institucional) europeo estea dixitalizado.
  •  2017: hai un 30% dixitalizado. 2018: é un importante ano para Europeana, a iniciativa europea de datos en aberto sobre o patrimonio cultural.
  •  2019: detéctase que un 20% do patrimonio dixitalizado xa non ten calidade suficiente para o seu uso coa tecnoloxía actual. A investigación si se conseguiu promover.
  •  2020: cóntase con 500.000 investigadores de Humanidades en Europa. 
  • 2021: é necesario preguntarse: permite o patrimonio cultural (institucional) europeo dixital a súa interoperabilidade (intercambio de datos e servizos software) e está garantido o seu acceso? E veremos que queda moito por avanzar na dixitalización e preservación do patrimonio, e que nalgúns casos non está garantido o acceso porque poden ser privados ou de pago, non ser interoperables porque non se dixitalizou utilizando os estándares necesarios. Bos exemplos do patrimonio cultural español xa dixitalizado son a Colección de mapas, planos e debuxos do Arquivo Xeral de Simancas, a interesante web do Museo do Prado, na Biblioteca Nacional de España ou na Fundación Pública Galega Centro Tecnolóxico de Supercomputación de Galicia.

Desta maneira, a profesora terminou a súa introdución ás Humanidades Dixitais e algúns aspectos de interese sobre o que supuxo a evolución da tecnoloxía e a IA na sociedade. Pasou a presentar o que chama “o misterio entre novelistas italianos”, un exemplo moi representativo dos problemas que se poden resolver con técnicas de procesamento da linguaxe natural (PLN), análise de datos e as humanidades dixitais. Refírese a como explotar técnicas e ferramentas de estilometría para concluír sobre evidencias de autoría de novelas. Para iso utilízase unha lingüística baseada en corpus e análise estatístico terminolóxico a partir de obras de 40 autores italianos entre os que se destacan 13 mulleres novelistas e autores dunha determinada rexión italiana. Por exemplo, emprégase un algoritmo para agrupar obxectos (palabras, parágrafos ou novelas), segundo a súa similitude. Pois ben, o estudo achega indicios claros de que a novelista superventas con pseudónimo Elena Ferrante e o novelista italiano Doménico Starnone son autores moi “próximos” en estilo e vocabulario. Con todo, estas pistas obtidas polas dúas investigadoras filólogas non son concluíntes, e iso que ademais sábese que os dereitos de autor das novelas da escritora Ferrante cóbraos a parella de Starnone!, que tamén é escritora, aínda que hai anos que non publica nada. 

A investigación en PNL e humanidades dixitais ten nestes momentos un foco de gran importancia no grupo de investigación da UNED de Procesamento da Linguaxe Natural (PLN) e Recuperación de Información (IR) en Humanidades Dixitais. A relatora foi citando brevemente algúns proxectos nos que investigou para pasar á terceira parte da súa conferencia na que utiliza o contexto dun dos seus proxectos, DIMH “O debuxante enxeñeiro ao servizo da monarquía hispánica. Séculos XVI- XVIII (HAR2012-31117) financiado polo ministerio entre 2013 e 2015, en cuxo contexto se segue investigando para facer unha panorámica da necesidade da tecnoloxía nas HD e como dar soporte á investigación dos humanistas. O PLN nas Humanidades Dixitais achega técnicas, recursos e ferramentas software para a representación de datos e información (metadatos e estándares) para

  •  a accesibilidade da información, mediante repositorios na web
  •  a xestión destes datos e información con técnicas complexas
  •  a súa visualización, mediante repositorios na web

E así citou aspectos necesarios no traballo das humanistas dixitais como é descargar datos ou información dixitalizada e enriquecela con nova información pertinente, indexar toda esa información e facilitar a navegación ou procuras configurables. Este proxecto ten varias etapas e é a partir de 2016 cando se aplican tecnoloxías emerxentes relacionadas coa web semántica, as redes neuronais e a aprendizaxe profunda. Desde hai un ano, a profesora incorpora os resultados deste proxecto nunha materia de máster para unha práctica avaliable. A relatora finalizou indicando centros nos que se pode estudar Humanidades Dixitais, cales son as asociacións nacionais e internacionais nas que atopar variada información sobre as humanidades dixitais. Achegou algunhas ideas e bastantes ligazóns sobre os contidos necesarios para formar un perfil ou curriculum que capacite aos profesionais e investigadores en humanidades dixitais.

Podes ver o relatorio aquí.

UNED Ourense

Comunicación

Carretera de Vigo Torres do Pino  s/n Baixo 32001 Ourense - . Tel. 988371444 info@ourense.uned.es