Changing the way you learn

ITERATIVE SEQUENCE OF STEPS
1. DATA CLEANING
2. DATA INTEGRATION
3. DATA SELECTION
4. DATA TRANSFORMATION
5. DATA MINING
  Annotations:
  - PROCESS OF DISCOVERING INTERESTING PATTERN AND KNOWLEDGE FROM LARGE AMOUNTS OF DATA
  1. DESCRIPTIVES
  2. PREDICTIVES
  3. DOMAINS
    1. STATISTICS
      Annotations:
      - Statistics studies the collection, analysis, interpretation or explanation, and presentation of data
    2. MACHINE LEARNING
      Annotations:
      - Machinelearning investigates how computers can learn (or improve their performance) based on data
    3. PATTERN RECOGNITION
    4. DATABASE
    5. DATA WAREHOUSE
    6. INFORMATION RETRIEVAL
    7. VISUALIZATION
    8. ALGORITHMS
    9. HIGH PERFORMANCE COMPUTING
  4. PATTERNS CAN BE MINED DATA MINING FUNCTIONALITIES
    1. DISCRIMINATION
      Annotations:
      - DISCRIMINATION: COMPARISON OF FEATURES OF ONE CLASS DATA OBJETC AGAINST GENERAL FEATURES OF OBJECTS FROM ONE OR MULTIPLE CLASS OBJECTS CHARACTERIZATION: summarizing the data of the class under study (often called the target class) in general terms
    2. FREQUEN PATTERNS
      Annotations:
      - There are many kinds of frequent patterns, including frequent itemsets, frequent subsequences (also known as sequential patterns), and frequent substructures.
      1. SUPPORT
      2. CONFIDENCE
      3. accuracy and coverage
    3. ASSOCIATIONS
    4. CORRELATIONS
    5. CLASSIFICATION AND REGRESSION
      Annotations:
      - Classification is the process of finding a model (or function) that describes and distinguishes data classes or concepts. Regression analysis is astatistical methodology that is most often used for numeric prediction,
    6. CLUSTERING ANALYSIS AND OULIER ANALYSIS
      Annotations:
      - Unlike classification and regression, which analyze class-labeled (training) data sets, clustering analyzes data objects without consulting class labels.
    7. INTERESTING PATTERNS
      1. NOVEL
      2. CERTAINTY
      3. POTENTIALLY USEFUL
      4. EASILY UNSDERSTOOD
      5. PATTERN INTERSTINGNESS
        SUBJECTIVE
        OBJECTIVE
  5. DATA CAN BE MINED
    1. DATABASES
    2. DATA WAREHOUSES
    3. TRANSACTIONAL DATA
    4. MANY OTHERS
  6. ISSUES OF DATA MINING RESEARCH
    1. MINING METHODOLOGIES
    2. USER INTERACTION
    3. EFFICIENCY AND SCALABILITY
    4. DIVERSITY OF DATA TYPES
    5. DATA MINING AND SOCIETY
  7. VIEWS
    1. APPLICATION
    2. TECHNOLOGIES
    3. DATA
    4. KNOWLEDGE
6. PATTERN EVALUATION
  Annotations:
  - ¿Interesante?: (1) easily understood byhumans, (2) valid on new or test data with some degree of certainty, (3) potentiallyuseful, and(4) novel. A pattern is also interesting if it validates a hypothesis that the user sought to confirm.
7. KNOWLEDGE PRESENTATION
APPLICATIONS
1. BUSINESS INTELIGENCE
2. WEB SEARCH
3. BIOINFORMATICS
4. HEALTH INFORMATICS
5. FINANCE
6. DIGITAL LIBRARIES
7. DIGITAL GOVERMENT

Next up

KNOWLEDGE DISCOVERY DATA

Description

Resource summary

Similar

	Created by Rosalía Iñiguez over 10 years ago