El proceso de extracción del conocimiento a partir del análisis de los datos (KDD) cobra especialmente relevancia en una época de exceso de información como es la actual. La disponibilidad de grandes volúmenes de datos y el uso generalizado de herramientas informáticas ha transformado el tratamiento de datos estableciendo un orden en las técnicas especializadas que se aplican y englobándolas en el proceso de extracción del conocimiento. Estas técnicas persiguen el descubrimiento automático del conocimiento contenido en la información almacenada de modo ordenado en grandes bases de atos, utilizando metodología avanzada de análisis de datos.
En este libro se explotan las capacidades de SPSS en su versión 17 para el trabajo en las distintas fases del proceso de extracción del conocimiento. Se recorren prácticamente todas las opciones posibles del programa y se aplican a casos prácticos convenientemente estructurados. En cada capítulo se presentan conceptos teóricos esenciales para la comprensión de las técnicas sin tener que realizar un esfuerzo metodológico adicional. Posteriormente cada técnica se ilustra con ejemplos adecuados que muestran su tratamiento con SPSS 17.
Las distintas fases del proceso de extracción del conocimiento se ordenan de acuerdo a la práctica establecida en el trabajo con minería de datos. En sucesivos capítulos se profundiza en las fases de selección, exploración, limpieza, tranformación, análisis de datos y evaluación e interpretación de resultados, mostrando en cada una de ellas las aplicaciones de análisis multivariante de datos correspondientes contenidas en los procedimientos de SPSS 17. CAPÍTULO 2. FASE DE SELECCIÓN EN EL PROCESO DE CAPÍTULO 3. FASE DE EXPLORACIÓN EN EL PROCESO DE EXTRACCIÓN DEL CONOCIMIENTO CAPÍTULO 4. FASE DE LIMPIEZA EN EL PROCESO DE EXTRACCIÓN DEL CONOCIMIENTO. CAPÍTULO 5. FASE DE TRANSFORMACIÓN EN EL PROCESO DE EXTRACCIÓN DEL CONOCIMIENTO CAPÍTULO 6. FASE DE ANÁLISIS DE DATOS EN EL PROCESO DE EXTRACCIÓN DEL CONOCIMIENTO. TÉCNICAS PREDICTIVAS: MODELOS DE REGRESIÓN Y SERIES TEMPORALES
1.1 EXTRACCIÓN DEL CONOCIMIENTO
1.2 TÉCNICAS DE ANÁLISIS DE DATOS
1.3 SPSS 17 Y EL PROCESO DE EXTRACCIÓN DEL CONOCIMIENTO. PRIMEROS PASOS
1.3.1 Instalación de SPSS 17
1.3.2 Comenzando con SPSS 17
1.3.3 Procedimientos para extracción del conocimiento
1.3.4 Editir de datos. Casos y variables
1.3.5 Editor de sintaxis
1.3.6 Visor de SPSS
1.3.7 Editor de gráficos de SPSS
1.3.8 Ayuda en SPSS 17
EXTRACCIÓN DEL CONOCIMIENTO
2.1 FUENTES DE DATOS
2.1.1 Leer y guardar archivos de datos
2.1.2 Importación de archivos de hoja de cálculo
2.1.3 Importación de archivos de base de datos
2.1.4 Importación de archivos de texto ASCII
2.2 SELECCIÓN DE CASOS Y VARIABLES EN SPSS
2.2.1 Selección de casos mediante criterios condicionales
2.2.2 Selección de fechas, horas y filas
2.2.3 Selección de una muestra aleatoria simple
2.2.4 Operadores para la selección de casos y variables en SPSS
2.3 SELECCIÓN DE MUESTRAS MEDIANTE MÉTODOS AVANZADOS DE MUESTREO
2.3.1 Asistente de muestreo de SPSS Muestreo estratificado
2.3.2 Asistente de muestreo de SPSS. Muestreo de conglomerados monoetápico y polietápico
3.1 EXPLORACIÓN DE LOS DATOS
3.2 ANÁLISIS EXPLORATORIO FORMAL DE LOS DATOS CON SPSS
3.2.1 Procedimiento Explorar
3.2.2 Contraste de aleatoriedad. Procedimiento Prueba de rachas
3.2.3 Contraste de ajuste a una distribución de frecuencias. Procedimiento Prueba de Kolmogorov-Smirnov
3.3 ANÁLISIS EXPLORATORIO Y VISUAL DE LOS DATOS
3.4 TIPOS DE GRÁFICOS
3.4.1 Generador de gráficos
3.4.2 Histogramas
3.4.3 Gráficos de caja y bigotes
3.4.4 Gráficos de dispersión
3.5 GRÁFICOS INTERACTIVOS DINÁMICOS DE ANÁLISIS EXPLORATORIO DE DATOS
3.5.1 Creación interactiva de gráficos a partir de tablas
3.5.2 Gráficos interactivos de caja y bigotes
3.5.3 Histogramas interactivos
3.5.4 Diagramas interactivos de dispersión
3.6 CORRELACIONES EN LA INFORMACIÓN
3.6.1 Análisis de correlaciones de variables numéricas en SPSS
3.5.2 Análisis de correlaciones de variables carácter en SPSS
4.1 INTRODUCCIÓN
4.2 ANÁLISIS Y DETECCIÓN DE VALORES ATÍPICOS
4.2.1 Detección de valores atípicos en SPSS mediante gráficos de control
4.2.2 Detección de casos atípicos en SPSS mediante gráficos de caja y bigotes
4.3 ANÁLISIS DE LOS DATOS MISSING
4.3.1 Tratamiento de los datos ausentes. Imputación
4.3.2 Tratamiento de los datos ausentes con SPSS
4.4 IMPUTACIÓN MÚLTIPLE CON SPSS 17
4.4.1 El procedimiento Analizar patrones
4.4.2 El procedimiento Imputar valores de datos perdidos
4.5 TRATAMIENTO DE LOS DATOS ATÍPICOS Y AUSENTES
SIMULTÁNEAMENTE CON SPSS 17
5.1 TRANSFORMACIÓN DE DATOS MEDIANTE TÉCNICAS DE REDUCCIÓN DE LA DIMENSIÓN
5.2 ANÁLISIS FACTORIAL Y COMPONENTES PRINCIPALES
5.2.1 Contrastes en el modelo factorial
5.2.2 Rotación de los factores
5.3.3 Interpretación gráfica de los factores y puntuaciones factoriales
5.3 ANÁLISIS FACTORIAL Y COMPONENTES PRINCIPALES EN SPSS
5.4 ANÁLISIS DE CORRESPONDENCIAS
5.4.1 SPSS y el análisis de correspondencias simple
5.4.2 SPSS y el análisis de correspondencias múltiple
5.5 ESCALAMIENTO MULTIDIMENSIONAL
5.5.1 Modelo INDSCAL con SPSS
5.5.2 Modelo PROXCAL con SPSS
5.6 MATCHING CON SPSS. TRANSPONER, FUSIONAR, AGREGAR, SEGMENTAR Y RECODIFICAR
5.7 REESTRUCTURAR ARCHIVOS DE DATOS
5.8 DISCRETIZAR VARIABLES
5.9 GENERAR NUEVAS VARIABLES
6.1 LA FASE DE ANÁLISIS DE DATOS
6.2 CLASIFICACIÓN DE LAS TÉCNICAS DE LA DEPENDENCIA
6.3 MODELO DE REGRESIÓN LINEAL MÚLTIPLE
6.3.1 Estimación del modelo, contrastes e intervalos de confianza
6.3.2 El análisis de los residuos
6.3.3 Autocorrelación, multicolinealidad y heteroscedasticidad
6.3.4 SPSS y la regresión lineal
6.3.5 Estimación ponderada y homoscedasticidad en SPSS
6.3.6 SPSS y mínimos cuadrados en dos fases. Variables instrumentales
6.3.7 SPSS y la Regresión ordinal
6.3.8 SPSS y la Regresión mediante escalamiento óptimo
6.4 MODELOS DE REGRESIÓN NO LINEALES
6.4.1 SPSS y la estimación no lineal. Estimación curvilínea
6.4.2 SPSS y la estimación no lineal general
6.5 INTRODUCCIÓN A LAS SERIES TEMPORALES
6.6 TENDENCIA DE UNA SERIE TEMPORAL
6.7 SPSS Y LA TENDENCIA DE LAS SERIES TEMPORALES
6.8 VARIACIONES ESTACIONALES EN UNA SERIE TEMPORAL
6.9 SPSS Y LA