La interdisciplinaridad es una caracteristica en
la automatizaiòn de la indizaciòn
Los sistemas de indizaciòn automàtica e pueden clasificar
en estadìsticos, lingüísticos o mixtos en funcion del peso
que tenga la frecuencia de las palabras o el tratamiento del
lenguaje en la concepcion y desarrollo de los mismos.
Con los primeros intentos para automatizar la
indizacion se iniciaron en los años sesenta y hasta 1990.
Fundamentarn sus ideas en los avances informativos
con el desarrollo de herramientas para el
Procesamientos del Lenguaje Natural (PLN).
Las principales ciencias o disciplinas a las que se recurre con la
lingüística, la informàtica, la estadìstica y la terminologìa. Los
aportes mas importantes que recibe la documentaciòn y en
particular la automatizaciòn de la indizaciòn, son la
lingüística y la informatica.
Lingüística
Un lenguaje documental tendrà que resolver complejidades
prensentes en el lenguaje natural como la polisemina la sinonimia, la
homonimia o la antonimia.La automatizaciòn de la indizaciòn se ha
sentado en el càlculo de la frecuencia de las palabras, en el anàlisis
automàtico del lenguaje de los textos o en ambos a la vez.
Terminologìa
Es el conjunto de conceptos de un campo del saber sistematizados,
explicados por medio de definiciones, explicaciones e ilustraciones
hechos comunicables mediante tèrminos. Las relaciones
fundamentales entre terminologìa y la documentaciòn derivan
porque la documentacion es un campo especializado con
terminologìa propia, la documentaciòn produce distintas
herramientas terminològicas.
Informàtica
Se ocupa del tratamiento automàtico de la informaciòn y ha permitido desde los
años cincuenta representaciòn y procesamiento, asì como su almacenamiento y
recuperaciòn de forma automatizada.
Estadìtica
Se aplica a los fenomenos de la lengua, lo que ha permitido la
determinaciòn de la riqueza lògica de un autor, el enclave de un
texto anònimo a una època o a un autor y el càlculo de la frecuencia
relativa de uso de las palabras para comprobar su capacidad
informativa.
Lingüística computacional
Es una disciplina entre la lingüística y la informàtica que se ocupa
del proceamiento automàtico de los texos a ravès del anàlisis
morfològico, sintactico y semantico del lenguaje, de la oraciòn y del
texto. Las herramientas mas utilizadas son los etiquetadores
morfològicos y los sintàcticos.