Bienvenido a la investigación de Oscar Saz

Doctor por la Universidad de Zaragoza

Becario Ministerio de Educacion/Fulbright

Asociado Post-doctoral en el
Language Technologies Institute
,
School of Computer Science
, Carnegie Mellon University.

New site in CMU

 

Lineas de investigación

--- Sistemas de enseñanza del lenguaje asistida por ordenador
--- Medidas de confianza y detección de errores en el habla
--- Tecnologías del habla para ayuda a la discapacidad
--- Adaptación acústica y léxica a trastornos del habla

Recursos de investigación

Comunica: Conjunto de herramientas logopédicas asistidas por ordenador
e-Comunica: Conjunto de herramientas logopédicas asistidas por ordenador mediante servicios web distribuidos (en desarrollo)

Informes Técnicos

O. Saz, J.-E. García, E. Lleida: "ACCESIBILIDAD EN LA WEB MEDIANTE VOZ A CIEGOS Y PERSONAS CON DEFICIENCIAS VISUALES". Tech. Report. 4 de Marzo de 2010.

Publicaciones más relevantes

Revistas internacionales
---- O. Saz, S.-C. Yin, E. Lleida, R. Rose, C. Vaquero, W.-R. Rodríguez: "Tools and Technologies for Computer-Aided Speech and Language Therapy". Speech Communication 51(10), 948-967, 2009.
---- O. Saz, J. Simón, W.-R. Rodríguez, E. Lleida: "Analysis of Acoustic Features in Speakers with Development Disorders and Speech Impairments". Eurasip Journal on Advances in Signal Processing, 2009
---- L. Buera, E. Lleida, A. Miguel, A. Ortega, O. Saz: "Cepstral Vector Normalization Based on Stereo Data for Robust Speech Recognition". IEEE Trans. Audio, Speech and Lang. Proc. 15(3), 1098-1113, 2007.
---- A. Miguel, E. Lleida, R. Rose, L. Buera, O. Saz, A. Ortega: "Capturing Local Variability for Speaker Normalization in Speech Recognition". IEEE Trans. Audio, Speech and Lang. Proc. 16(3), 578-593, 2008.
---- L. Buera, A. Miguel, O. Saz, A. Ortega, E. Lleida: "Unsupervised Data-Driven Feature Vector Normalization with Acoustic Model Adaptation for Robust Speech Recognition".
IEEE Trans. Audio, Speech and Lang. Proc. 18(2), 296-309, 2010.
---- W.-R. Rodríguez, O. Saz, E. Lleida: "A Prelingual Tool for the Education of Altered Voices". Speech Communication: Under review.

Revistas nacionales
---- O. Saz, J. Simón, E. Dallal, E. Lleida, R. Rose: "Modelado acústico de los errores en la realización de fonemas reconocimiento automático del habla alterada". Language Design (Journal of Theoretical and Experimental Linguistics), 249-256, 2008.
----
O. Saz, W.-R. Rodríguez, C. Vaquero, A. Escartín, E. Lleida, J.-M. Marcos, C. Canalís: "Consideraciones en el desarrollo de herramientas informáticas para logopedia en educación especial". Maremágnum (Publicación galega sobre os trastornos do espectro autista) 13, 131-138, 2009.
---- O. Saz, W.-R. Rodríguez, E. Lleida: "Development of Voice-Based Tools for Accessibility to Computer Services". Computación Y Sistemas: Under review.

Capítulos de libro
---- O. Saz, E. Lleida, V. Rodríguez, W.-R. Rodríguez, C. Vaquero: "The Use of Synthetic Speech in Language Learning Tools: Review and a Case Study". In J.-W. Mullenix, S. Stern (eds.): "Computer Synthesized Speech Technologies: Tools for Aiding Impairment". Information Science Reference: USA, 2010.
---- O. Saz, V. Rodríguez, E. Lleida, W.-R. Rodríguez, C. Vaquero: "The Use of Multimodal Tools for Pronunciation Training in Second Language Learning of Preadolescents". In C.-A. Hernández (ed.): "Language Teaching: Techniques, Developments and Effectiveness". Nova Science: USA, 2010.

Conferencias internacionales
---- L. Buera et al., "Speaker verification and identification using Phoneme Dependent Multi-Environment Models based Linear Normalization in adverse and dynamic acoustic environments", Summer School on Biometrics, Alghero (ITA), 2005
---- O. Saz et al., "Study of Time and Frequency Variability in Pathological Speech and Error Reduction Methods for Automatic Speech Recognition", ICSLP-Interspeech, Pittsburgh (USA), 2006.
---- A. Miguel et al., "Local Transformation Models for Speech Recognition", ICSLP-Interspeech, Pittsburgh (USA), 2006.
---- L. Buera et al., "Cross-Probability Model based on GMM for Feature Vector Normalization in Car Environments", Biennial on DSP for in-Vehicle and Mobile Systems, Istanbul (TUR), 2007.
---- A. Miguel et al., "On-Line Feature and Acoustic Model Space Compensation for Robust Speech Recognition in Car Environment", IEEE Intelligent Vehicles Symposium, 2007.
---- L. Buera et al., "On the Jointly Unsupervised Feature Vector Normalization and Acoustic Model Compensation for Robust Speech Recognition", Eurospeech-Interspeech, Antwerp (BEL), 2007.
---- L. Buera et al., "Evaluation of the Combined Use of MEMLIN and MLLR on the Non-native Adaptation Task of Hiwire Project Database", Eurospeech-Interspeech, Antwerp (BEL), 2007.
---- W.-R. Rodríguez et al., "Aplicación de las Tecnologías del Habla al Aprendizaje del Prelenguaje y el Lenguaje", IV Congreso Latinoamericano de Ingenieria Biomedica, Isla Margarita (VEN), 2007.
---- L. Buera et al., "Robust Speech Recognition with on-line Unsupervised Acoustic Feature Compensation", ASRU workshop, Kyoto (JAP), 2007.
---- R. Justo et al., "Improving Dialogue Systems in a Home Automation Environment", Ambi-Sys 2008, Québec City (CAN), 2008.
---- C. Vaquero et al., "Human Language Technologies for Speech Therapy in Spanish Language", LangTech 2008, Rome (ITA), 2008.
---- C. Vaquero et al., "E-Inclusion Technologies for the Speech Handicapped", ICASSP 2008, Las Vegas (USA), 2008.
---- W.-R. Rodríguez et al., "Speech Technology Applied to Children with Speech Disorders", BioMed2008, Kuala Lumpur (MAL), 2008.
---- S.-C. Yin et al., "Verifying Pronunciation Accuracy from Dysarthric Speech", ICSLP-Interspeech, Brisbane (AUS), 2008.
---- L. Buera et al., "Feature Vector Normalization with Combined Standard and Throat Microphones for Robust ASR", ICSLP-Interspeech, Brisbane (AUS), 2008.
---- O. Saz et al., "A Novel Corpus of Children’s Impaired Speech", WOCCI, Chania (GRE), 2008.
---- W.-R. Rodríguez et al., "COMUNICA - Tools for Speech and Language Therapy", WOCCI, Chania (GRE), 2008.
---- S.-C. Yin et al., "A Study of Pronunciation Verification in a Speech Therapy Application", ICASSP 2009, Taipei (TAI), 2009.
---- O. Saz et al., "Acoustic-phonetic decoding for assessment of mispronunciations in speakers with cognitive disorders", AVFA, Madrid (SPA), 2009.
---- O. Saz et al., "An Experience with a Spanish Second Language Learning Tool in a Multilingual Environment", SLaTE workshop, Wroxall Abbey (UK), 2009.
---- O. Saz et al., "Combination of Acoustic and Lexical Speaker Adaptation for Disordered Speech Recognition", Eurospeech-Interspeech, Brighton (UK), 2009.
---- O. Saz et al., "Avoiding Speaker Variability in Pronunciation Verification of Children’ Disordered Speech", WOCCI, Cambridge (USA), 2009.

---- O. Saz et al., "The Alborada-I3A corpus of disordered speech", LREC, La Valletta (MAL), 2010.
---
- W.-R. Rodríguez et al. "ARTICULA - A novel tool for Spanish Vowel Training in Real Time", Workshop on L2 studies, Tokyo (JAP), 2010.

Conferencias nacionales
---- O. Saz et al., "Algoritmos de Compensación de Características Cepstrales para Reconocimiento Automático del Habla Robusto", 3as Jornadas en Tecnologías del Habla, Valencia, 2004.
---- L. Buera et al., "Avances en la Normalización Cepstral con Señal Estereo para el Reconocimiento Robusto de Voz en el Entorno del Vehiculo", 3as Jornadas en Tecnologías del Habla, Valencia, 2004.
---- A. Miguel et al., "Decodificador Eficiente para Normalización de Tracto Vocal en Reconocimiento Automático del Habla en Tiempo Real", 3as Jornadas en Tecnologías del Habla, Valencia, 2004.
---- J.-M. Alcubierre et al., "Silla de ruedas inteligente controlada por voz", Primer Congreso Internacional de Domotica, Robotica y Teleasistencia para todos, Madrid, 2005.
---- O. Saz et al., "Study of Maximum A Posterior Speaker Adaptation for Pathological Speech", 4as Jornadas en Tecnología del Habla, Zaragoza, 2006.
---- C. Vaquero et al., "Vocaliza – An Application for Computer-Aided Speech Therapy in Spanish Language", 4as Jornadas en Tecnología del Habla, Zaragoza, 2006.
---- L. Buera et al., "Time-Dependent Cross-Probability Model for Feature Vector Normalization", 4as Jornadas en Tecnología del Habla, Zaragoza, 2006.
---- A. Uría et al., "A Virtual Butler Controlled By Speech", 4as Jornadas en Tecnología del Habla, Zaragoza, 2006.
---- L. Buera et al., "Verificación e Identificación de Locutor con Normalización de Vectores de Características en Entornos Acústicos Adversos", Terceras Jornadas de Reconocimiento Biométrico de Personas, Sevilla, 2006.
---- B. Martínez et al., "Universidad y Educación Especial: Desarrollo y Resultados de la Colaboración entre el Centro Politecnico Superior y el Centro de Educación Especial "Alborada"", III Congreso Nacional sobre Universidad y Discapacidad, Zaragoza, 2007.
---- C. Vaquero et al., "Tecnologías del habla para el desarrollo del lenguaje", Telecom I+D, Valencia, 2007.
---- O. Saz et al., "Modelado Acústico de los Errores en la Realización de Fonemas para Reconocimiento Automático del Habla Alterada", IV Congreso en Fonética Experimental, Granada, 2008.
---- J. Villalba et al., "Experiencia del I3A en la Evaluación de Reconocimiento de Locutor NIST 2008", IV Jornadas de Reconocimiento Biométrico de Personas, Valladolid, 2008.
---- O. Saz et al., "COMUNICA - PLATAFORMA PARA EL DESARROLLO, DISTRIBUCIÓN Y EVALUACIÓN DE HERRAMIENTAS LOGOPÉDICAS ASISTIDAS POR ORDENADOR", V Jornadas en Tecnologías del Habla, Bilbao, 2008.
---- W.-R. Rodríguez et al., "Habilitación del Pre-Lenguaje y el Lenguaje con COMUNICA, una Herramienta libre basada en TICs", VIII Congreso Iberoamericano de Informática y   Educación Especial, San José (COS), 2009.
---- O. Saz et al., "MOUSECLICK: ACCESO AL ORDENADOR A TRAVÉS DE LA VOZ", II Congreso Nacional de Comunicación Aumentativa, Zaragoza, 2009.
---- O. Saz et al., "MOUSECLICK: ACCESO AL ORDENADOR A TRAVÉS DE LA VOZ", IV Jornadas Iberoamericanas de Tecnologías de Apoyo a Discapacidad, Madrid, 2009.

--
-- C. Vaquero et al., "REFOCAS: Registro fonologico castellano / REFOGAL: Rexistro fonoloxico galego", Tecnoneet 2010, Murcia, 2010.
--
-- O. Saz et al., "A Prototype of Distributed Speech Technologies for the Development of Websites Accessible to the Blind Community", Fala 2010, Vigo, 2010.
--
-- W.-R. Rodriguez et al., "On Line Vocal Tract Length Estimation for Speaker Normalization in Speech Recognition", Fala 2010, Vigo, 2010.
--
-- D. Becerril et al., "Speaker Tree Generation for Model Selection in Automatic Speech Recognition", Fala 2010, Vigo, 2010.