KDD

Description

Knowledge Discovery in Databases
RUBEN LADRON DE G
Mind Map by RUBEN LADRON DE G, updated more than 1 year ago
RUBEN LADRON DE G
Created by RUBEN LADRON DE G about 5 years ago
176
0

Resource summary

KDD
  1. Definición: Kamber (2011), proceso de descubrir conocimiento potencialmente útil dentro de datos. Webmining (2011) resalta que es un proceso que explora volúmenes grandes de datos para determinar relaciones. Extrae información de calidad para dibujar conclusiones basadas en relaciones o modelos.
      1. Necesidades: Aumento de volumen y variedad en información dentro de bases de datos, así como distintas y nuevas fuentes donde se encuentran los datos. Necesidad importante por integrar el conocimiento para toma de decisiones importantes y complejas. Algunas áreas de aplicación:
        1. Medicina
          1. Marketing
            1. Trafico
              1. Etcétera
              2. Procesos:
                1. Fase 1- a)Determinar: fuentes de datos útiles b)Forma de obtención de dichas fuentes c)Homologar formato de información (resolver inconsistencias) y d)Generar almacén de datos
                  1. Fase 2- Eliminación y corrección de datos incorrectos o faltantes. Determinar variables o atributos relevantes para la minería de datos. Construcción de atributos. Determinar muestras estadísticas.
                    1. Fase 3- Generar nuevo conocimiento a partir de métodos y algoritmos y extraer el conocimiento de bases de datos. Tenemos tres pasos: Determinar las tareas, determinar el método y seleccionar el algoritmo.
                      1. Tipo de tareas: Predictivas (Clasificación, Regresión) o Descriptivas (Agrupamiento, correlación, reglas asociación, asociación secuencial)
                        1. Métodos- Nos permiten resolver tareas, algunos importantes son: Inferencia, estadística, árboles de decisión, redes neuronales, inducción de reglas, algoritmos genéticos, basados en núcleos, aprendizaje bayesiano.
                        2. Fase 4- Evaluación de la calidad de lo descubierto mediante distintos criterios. La elección de la evaluación del método dependerá de la técnica elegida. Resaltamos dos actividades: Evaluación de patrones y análisis de expertos y evaluación y entendimiento del contexto real en el cual se usará el método.
                          1. Conjuntos de datos: Entrenamiento y Prueba
                            1. Modelos: Validación simple, Cruzada, Bootstrapping
                            2. Fase 5- Monitoreo y uso que genere acciones valiosas. Cuantificar los resultados. Buscar incoporarla en el contexto laboral para facil adopción.
                            Show full summary Hide full summary

                            Similar

                            DESCUBRIMIENTO DEL CONOCIMIENTO EN BD (KDD)
                            Antonio Nicolás García
                            ARQUITECTURA DE UNA BD INTELIGENTE
                            Yolanda Eloisa S
                            El Túnel
                            Jose Guerrero
                            The USA, 1919-41
                            sagar.joban
                            Finance
                            pamelamossman
                            Villainy In Macbeth
                            Isaac Evans
                            C1:Making Crude Oil Useful (Science-GCSE)
                            Temi Onas
                            AS Media Studies Terminology
                            Mourad
                            The Periodic Table
                            asramanathan
                            Information security and data protection
                            хомяк убийца