Entre las aplicaciones cabe destacar;
* La comunicación hombre-máquina, consiguiendo que sea lo más amigable posible: interpretar órdenes (reconocimiento del habla), permitir accesos (reconocimiento de locutor), recibir información de forma oral (conversión texto-voz), etc.
* Uso eficiente de recursos: extraer la información relevante de forma que se ocupe el mínimo ancho de banda posible en aplicaciones de transmisión y/o almacenamiento (codificación de voz e imagen), con especial énfasis en los estándares multimedia.
* Reconocimiento de formas, identificación biométrica de personas, protección de los derechos de la propiedad intelectual, etc.
* Se incluyen numerosas figuras y tablas con las direcciones donde obtener más información de los diferentes productos existentes en el mercado.
Esta obra puede ser adecuada para cursos universitarios y ciclos formativos relacionados con el tratamiento de voz e imagen, aplicaciones multimedia, teoría de la información, realización de trabajos y proyectos de final de carrera, etc., así como para todos aquellos profesionales del sector que deseen actualizar sus conocimientos o introducirse en la materia. 1.1. Tipos de señales 1.2. Cuantificación vectorial 1.2.1. Concepto 1.2.2. Proceso de cuantificación 1.2.3. Obtención del codebook inicial 1.2.3.1. Método aleatorio (random) 1.2.3.2. Método de poda (pruning) 1.2.3.3. Método de splitting 1.2.4. Mejora del codebook 1.2.4.1. Iteración de Lloyd 1.2.4.2. Algoritmo de Lloyd generalizado 1.2.5. Variantes de la cuantificación vectorial 1.2.5.1. Cuantificación vectorial clasificada 1.2.5.2. Cuantificación vectorial de vectores transformados 1.2.5.3. Cuantificación vectorial de ganancia y forma 1.2.6. Aplicaciones 1.2.6.1. Codificación Block Truncation Coding (BTC) de imágenes con cuantificación vectorial 1.2.6.2. Cuantificación vectorial de coeficientes LPC (LPC-VQ) 1.3. Redes neuronales artificiales 1.3.1. La neurona biológica 1.3.2. Modelo de neurona artificial 1.3.3. Arquitectura de una Red Neuronal Artificial (RNA) 1.3.3.1. Redes progresivas 1.3.3.2. Redes realimentadas 1.3.4. Aprendizaje 1.3.5. Aplicaciones de las RNA 1.4. Filtros no lineales 1.4.1. Concepto Tipos de filtros 1.4.2. Filtros de estadísticos ordenados (OS) 2. TRATAMIENTO DE VOZ 2.1. Introducción y aplicaciones 2.2. Fundamentos en tratamiento del habla 2.2.1. Sistema fonador humano 2.2.2. Digitalización de voz 2.3. Codificación de voz 2.3.1. Codificación de forma de onda 2.3.1.1. Cuantificación 2.3.1.2. Predicción lineal 2.3.1.3. Estimación de pitch 2.3.1.4. Espectros y cepstrum 2.3.1.5. Codificación diferencial 2.3.1.6. Modulación delta 2.3.2. Codificación paramétrica 2.3.2.1. Codificación por predicción lineal (LPC) 2.3.2.2. Codificadores de voz mediante análisis por síntesis 2.3.2.3. Excitación por codebook 2.3.2.4. Autoexcitación 2.3.2.5. Multipulso 2.3.3. Evaluación de los codificadores 2.4. Conversión texto-voz 2.4.1. Introducción 2.4.2. Sistemas de respuesta oral versus convertidores texto-voz 2.4.3. Conversión texto-voz 2.4.3.1. Análisis lingüístico del texto 2.4.3.2. Generación de la prosodia 2.4.3.3. Síntesis de la señal de voz 2.4.4. Generación de la base de unidades 2.5. Reconocimiento 2.5.1. Introducción 2.5.2. Aplicaciones 2.5.2.1. Aplicaciones del reconocimiento automático del habla 2.5.2.2. Aplicaciones de reconocimiento de locutor 2.5.3. Reconocimiento de locutor 2.5.3.1. Introducción 2.5.3.2. Adquisición de la señal de voz 2.5.3.3. Extracción de características 2.5.3.4. Modelado no paramétrico 2.5.3.5. Modelos paramétricos 2.5.4. Reconocimiento del habla 2.5.4.1. Introducción 2.5.4.2. Cuantificación vectorial 2.5.4.3. Ajuste de plantillas 2.5.4.4. Métodos estocásticos 2.5.5. Sistemas comerciales 3. TRATAMIENTO DE IMAGEN 3.1. Introducción 3.2. Mejora de imágenes 3.2.1. Introducción 3.2.2. Operaciones puntuales 3.2.2.1. Función definida a intervalos 3.2.2.2. Negativo de una imagen 3.2.2.3. Extracción de bits 3.2.2.4. Procedimientos basados en el histograma 3.2.3. Operaciones espaciales 3.2.3.1. Filtrado espacial 3.2.3.2. Suavizado direccional 3.2.3.3. Filtrado de mediana 3.2.3.4. Ampliación de imágenes 3.2.4. Operaciones transformadas 3.2.5. Restauración de imágenes 3.2.6. Pseudocolor 3.3. Compresión 3.3.1. Introducción Tipos y aplicaciones 3.3.1.1. Aplicaciones 3.3.1.2. Máxima compresión conseguible sin error 3.3.2. Codificación de pixel 3.2.2.1. PCM 3.3.2.2. Cuantificación de contraste 3.3.2.3. Dithering 3.3.2.4. Codificación entrópica 3.3.2.5. RLE (Run Length Encoding) 3.3.2.6. Codificación de bit plane 3.3.3. Codificación predictiva 3.3.3.1. DPCM (Differential Pulse Code Modulation) 3.3.3.2. Modulación delta 3.3.3.3. Técnicas adaptativas 3.3.4. Codificación transformada 3.3.4.1. Codificación zonal y codificación umbral 3.3.4.2. Codificación transformada adaptativa 3.3.5. Codificación híbrida 3.3.6. Codificación piramidal 3.3.7. JPEG (Joint Photographic Experts Group) 3.3.8. Codificación de imágenes en color 3.4. Secuencias de imágenes 3.4.1. Aplicaciones 3.4.2. Estimación de movimiento 3.4.2.1. Método three step 3.4.2.2. Método conjugado modificado 3.4.3. Predicción 3.5. Morfología matemática 3.5.1. Definición 3.5.2. Operaciones 3.6. Visión artificial 3.6.1. Detección de contornos 3.6.2. Formas de objetos 3.6.2.1. Método de las firmas 3.6.3. Reconocimiento óptico de caracteres 3.6.3.1. Método de los perfiles 3.6.3.2. Reconocimiento de caracteres por el método de los perfiles 3.6.3.3. OCR con red neuronal 3.6.4. Reconocimiento de personas mediante características biométricas 3.6.4.1. Aplicaciones y ventajas sobre los métodos tradicionales 3.6.4.2. Precisión del sistema 3.6.4.3. Cuestiones importantes 3.6.4.4. Huellas dactilares 3.6.4.5. Geometría de la mano 3.6.4.6. Geometría de los dedos 3.6.4.7. Venas de las manos 3.6.4.8. Retina 3.6.4.9. Iris 3.6.4.10. Firma 3.6.4.11. Reconocimiento de caras 3.6.4.12. Mejoras en las aplicaciones de verificación 3.6.4.13. Sistemas implantados en la actualidad 4. SISTEMAS MULTIMEDIA 4.1. Equipos de videoconferencia 4.1.1. Compresión de imágenes mediante H.261 4.1.1.1. Esquema del codificador 4.1.2. Estándar H.263 4.1.3. Diferencias entre los sistemas H.263 y H.261 4.1.4. Estándar H.263 versión 2 4.2. Estándares de codificación MPEG 4.2.1. Estándar MPEG-1 para codificación de imagen 4.2.2. Estándar MPEG-2 para codificación de imagen 4.2.3. Estándar MPEG-3 para codificación de imagen 4.2.4. Estándar MPEG-4 para codificación de imagen 4.2.5. Estándar MPEG-7 4.3. Codificación de audio 4.3.1. Estándar de codificación de audio MPEG-1 4.3.2. Estándar de codificación de audio MPEG-2 4.3.3. Estándar de codificación de audio MPEG-4 4.4. Nuevos estándares 4.5. H.323: Estándar de sistemas de comunicaciones multimedia sobre redes basadas en paquetes 4.5.1. Introducción 4.5.2. Características de los terminales H.323 4.5.3. Interoperabilidad con otros terminales de transmisión de datos, audio y/o vídeo 4.5.4. Equipos disponibles en el mercado 4.5.5. Videoconferencia sobre Internet 4.5.6. Coste de los equipos 4.6. Nuevas tecnologías y protección de los derechos de la propiedad intelectual 4.6.1. Introducción 4.6.1.1. Información oculta y criptografía 4.6.1.2. Información oculta y firma digital 4.6.1.3. Información oculta y marcas de agua 4.6.2. Tipos de marcas de agua 4.6.3. Marcado de imágenes 4.6.4. Marcado de señales de audio 4.6.5. Marcado de textos 4.6.6. Programas comerciales 5. PROBLEMAS 6. BIBLIOGRAFÍA