KDD

Description

Knowledge Discovery in Databases
RUBEN LADRON DE G
Mind Map by RUBEN LADRON DE G, updated more than 1 year ago
RUBEN LADRON DE G
Created by RUBEN LADRON DE G almost 5 years ago
175
0

Resource summary

KDD
  1. Definición: Kamber (2011), proceso de descubrir conocimiento potencialmente útil dentro de datos. Webmining (2011) resalta que es un proceso que explora volúmenes grandes de datos para determinar relaciones. Extrae información de calidad para dibujar conclusiones basadas en relaciones o modelos.
      1. Necesidades: Aumento de volumen y variedad en información dentro de bases de datos, así como distintas y nuevas fuentes donde se encuentran los datos. Necesidad importante por integrar el conocimiento para toma de decisiones importantes y complejas. Algunas áreas de aplicación:
        1. Medicina
          1. Marketing
            1. Trafico
              1. Etcétera
              2. Procesos:
                1. Fase 1- a)Determinar: fuentes de datos útiles b)Forma de obtención de dichas fuentes c)Homologar formato de información (resolver inconsistencias) y d)Generar almacén de datos
                  1. Fase 2- Eliminación y corrección de datos incorrectos o faltantes. Determinar variables o atributos relevantes para la minería de datos. Construcción de atributos. Determinar muestras estadísticas.
                    1. Fase 3- Generar nuevo conocimiento a partir de métodos y algoritmos y extraer el conocimiento de bases de datos. Tenemos tres pasos: Determinar las tareas, determinar el método y seleccionar el algoritmo.
                      1. Tipo de tareas: Predictivas (Clasificación, Regresión) o Descriptivas (Agrupamiento, correlación, reglas asociación, asociación secuencial)
                        1. Métodos- Nos permiten resolver tareas, algunos importantes son: Inferencia, estadística, árboles de decisión, redes neuronales, inducción de reglas, algoritmos genéticos, basados en núcleos, aprendizaje bayesiano.
                        2. Fase 4- Evaluación de la calidad de lo descubierto mediante distintos criterios. La elección de la evaluación del método dependerá de la técnica elegida. Resaltamos dos actividades: Evaluación de patrones y análisis de expertos y evaluación y entendimiento del contexto real en el cual se usará el método.
                          1. Conjuntos de datos: Entrenamiento y Prueba
                            1. Modelos: Validación simple, Cruzada, Bootstrapping
                            2. Fase 5- Monitoreo y uso que genere acciones valiosas. Cuantificar los resultados. Buscar incoporarla en el contexto laboral para facil adopción.
                            Show full summary Hide full summary

                            Similar

                            DESCUBRIMIENTO DEL CONOCIMIENTO EN BD (KDD)
                            Antonio Nicolás García
                            ARQUITECTURA DE UNA BD INTELIGENTE
                            Yolanda Eloisa S
                            El Túnel
                            Jose Guerrero
                            History of Psychology
                            Reuben Caruana
                            Advantages and Disadvantages of Parliamentary Law making
                            Sinead Gapp
                            Paradise Lost Themes/Quotes
                            Kirsty S
                            PHR Sample Questions
                            Elizabeth Rogers8284
                            2PR101 1.test - 6. část
                            Nikola Truong
                            Romeo and Juliet notes
                            Faizaan Mohmed
                            Two years and no baby
                            Zahra Habeeb