KDD

Description

Knowledge Discovery in Databases
RUBEN LADRON DE G
Mind Map by RUBEN LADRON DE G, updated more than 1 year ago
RUBEN LADRON DE G
Created by RUBEN LADRON DE G about 5 years ago
176
0

Resource summary

KDD
  1. Definición: Kamber (2011), proceso de descubrir conocimiento potencialmente útil dentro de datos. Webmining (2011) resalta que es un proceso que explora volúmenes grandes de datos para determinar relaciones. Extrae información de calidad para dibujar conclusiones basadas en relaciones o modelos.
      1. Necesidades: Aumento de volumen y variedad en información dentro de bases de datos, así como distintas y nuevas fuentes donde se encuentran los datos. Necesidad importante por integrar el conocimiento para toma de decisiones importantes y complejas. Algunas áreas de aplicación:
        1. Medicina
          1. Marketing
            1. Trafico
              1. Etcétera
              2. Procesos:
                1. Fase 1- a)Determinar: fuentes de datos útiles b)Forma de obtención de dichas fuentes c)Homologar formato de información (resolver inconsistencias) y d)Generar almacén de datos
                  1. Fase 2- Eliminación y corrección de datos incorrectos o faltantes. Determinar variables o atributos relevantes para la minería de datos. Construcción de atributos. Determinar muestras estadísticas.
                    1. Fase 3- Generar nuevo conocimiento a partir de métodos y algoritmos y extraer el conocimiento de bases de datos. Tenemos tres pasos: Determinar las tareas, determinar el método y seleccionar el algoritmo.
                      1. Tipo de tareas: Predictivas (Clasificación, Regresión) o Descriptivas (Agrupamiento, correlación, reglas asociación, asociación secuencial)
                        1. Métodos- Nos permiten resolver tareas, algunos importantes son: Inferencia, estadística, árboles de decisión, redes neuronales, inducción de reglas, algoritmos genéticos, basados en núcleos, aprendizaje bayesiano.
                        2. Fase 4- Evaluación de la calidad de lo descubierto mediante distintos criterios. La elección de la evaluación del método dependerá de la técnica elegida. Resaltamos dos actividades: Evaluación de patrones y análisis de expertos y evaluación y entendimiento del contexto real en el cual se usará el método.
                          1. Conjuntos de datos: Entrenamiento y Prueba
                            1. Modelos: Validación simple, Cruzada, Bootstrapping
                            2. Fase 5- Monitoreo y uso que genere acciones valiosas. Cuantificar los resultados. Buscar incoporarla en el contexto laboral para facil adopción.
                            Show full summary Hide full summary

                            Similar

                            DESCUBRIMIENTO DEL CONOCIMIENTO EN BD (KDD)
                            Antonio Nicolás García
                            ARQUITECTURA DE UNA BD INTELIGENTE
                            Yolanda Eloisa S
                            El Túnel
                            Jose Guerrero
                            Computing
                            Ben Leader
                            ICT Revision 2014
                            11RaceyG
                            GCSE Mathematics Topics
                            goldsmith.elisa
                            BIOLOGY HL DEFINITIONS IB
                            Luisa Mandacaru
                            AQA GCSE Biology B1- Quiz
                            Ethan Beadling
                            AQA Power and Conflict Poem Quotes
                            Holly Benson
                            ASSD & PSBD QUESTION 2018 200
                            Dhiraj Tamang