Technical Program

Monday 25 June 2012
9:00 - 9:30	Registration
9:30 - 10:00	Opening
10:00 - 11:00	Plenary Session 1: The Role of Proper Scoring Rules in Training and Evaluating Probabilistic Speaker and Language Recognizers
11:00 - 11:30	Coffee break
11:30 - 13:10	Session 1: Speaker Recognition – Compact Representation
13:10 - 14:00	Lunch
14:00 - 16:05	Session 2: Speaker Recognition – Generative modeling
16:05 - 16:30	Coffee break
16:30 - 17:45	Session 3: Forensic Speaker Recognition
17:45 - 22:00	Welcome Reception @ Tiger Brewery
Tuesday 26 June 2012
9:00 - 10:00	Plenary Session 2: Being Deep and Being Dynamic – New-Generation Models and Methodology for Advancing Speech Technology
10:00 - 10:30	Coffee break
10:30 - 12:35	Session 4: Neural Network for Speaker Recognition
12:35 - 13:30	Lunch
13:30 - 15:35	Session 5: Speaker Diarization
15:35 - 16:00	Coffee break
16:00 - 18:05	Session 6: Speaker Recognition – Channel Robustness
Wednesday 27 June 2012
9:00 - 10:00	Plenary Session 3: The NIST Speaker Recognition Evaluations
10:00 - 10:30	Coffee break
10:30 - 12:35	Session 7: Language Recognition Evaluation
12:35 - 13:30	Lunch
13:30 - 15:35	Session 8: Features for Speaker Recognition
15:35 - 22:00	Social Event + Banquet @ Megu
Thursday 28 June 2012
9:15 - 10:00	"Dim Sum" morning
10:00 - 12:05	Session 9: Speaker Recognition Evaluation
12:05 - 13:00	Lunch
13:00 - 15:05	Session 10: Speaker Recognition – Application
15:05 - 15:30	Coffee break
15:30 - 17:35	Session 11: Language Recognition – Feature, Classifier and Fusion

Session 1: Speaker Recognition – Compact Representation
Monday 25 June 2012

11:30 - 11:55	A Small Footprint i-Vector Extractor Patrick Kenny [Abstract]
11:55 - 12:20	Memory and Computation Effective Approaches for i–Vector Extraction Sandro Cumani, Pietro Laface and Vasileios Vasilakakis [Abstract]
12:20 - 12:45	A Hybrid Factor Analysis and Probabilistic PCA-based system for Dictionary Learning and Encoding for Robust Speaker Recognition Srikanth Madikeri [Abstract]
12:45 - 13:10	On Exploring the Similarity and Fusion of i-Vector and Sparse Representation based Speaker Verification Systems Haris B C and Rohit Sinha [Abstract]

Session 2: Speaker Recognition – Generative modeling
Monday 25 June 2012

14:00 - 14:25	PLDA based Speaker Recognition on Short Utterances Ahilan Kanagasundaram, Robbie Vogt, David Dean and Sridha Sridharan [Abstract]
14:25 - 14:50	PLDA based Speaker Verification with Weighted LDA Techniques Ahilan Kanagasundaram, David Dean, Sridha Sridharan and Robbie Vogt [Abstract]
14:50 - 15:15	Dataset Shift in PLDA based Speaker Verification Carlos Vaquero [Abstract]
15:15 - 15:40	Bayesian Adaptation of PLDA Based Speaker Recognition to Domains with Scarce Development Data Jesus Villalba and Eduardo Lleida [Abstract]
15:40 - 16:05	Source Normalization for Language-Independent Speaker Recognition using i-Vectors Mitchell McLaren, Miranti Indar Mandasari and David A. van Leeuwen [Abstract]

Session 3: Forensic Speaker Recognition
Monday 25 June 2012

16:30 - 16:55

Database Selection for Forensic Voice Comparison
Geoffrey Stewart Morrison, Felipe Ochoa, Tharmarajah Thiruvaran

[Abstract]

16:55 - 17:20

Voice Source Features for Forensic Voice Comparison - an Evaluation of the GLOTTEX Software Package
Ewald Enzinger, Cuiling Zhang and Geoffrey Stewart Morrison

[Abstract]

17:20 - 17:45

Comparison of Speaker Recognition Systems on a Real Forensic Benchmark

Yosef Solewicz, Timo Becker, Jardine Gaelle and Stefan Gfroerer

[Abstract]

Session 4: Neural Network for Speaker Recognition
Tuesday 26 June 2012

10:30 - 10:55	Factor Analysis of Mixture of Auto-Associative Neural Networks for Speaker Verification Sivaram Garimella and Hynek Hermansky [Abstract]
10:55 - 11:20	Adaptation Transforms of Auto-Associative Neural Networks as Features for Speaker Verification Samuel Thomas, Sri Harish Mallidi, Sriram Ganapathy and Hynek Hermansky [Abstract]
11:20 - 11:45	Bottleneck Features for Speaker Recognition Sibel Yaman, Jason Pelecanos and Ruhi Sarikaya [Abstract]
11:45 - 12:10	Preliminary Investigation of Boltzmann Machine Classifiers for Speaker Recognition Themos Stafylakis, Patrick Kenny, Mohammed Senoussaoui and Pierre Dumouchel [Abstract]
12:10 - 12:35	First attempt of Boltzmann Machines for Speaker Verification Mohammed Senoussaoui, Najim Dehak, Patrick Kenny, Réda Dehak and Pierre Dumouchel [Abstract]

Session 5: Speaker Diarization
Tuesday 26 June 2012

13:30 - 13:55	Online Two Speaker Diarization Hagai Aronowitz, Yosef Solewicz and Orith Toledo-Ronen [Abstract]
13:55 - 14:20	On the use of Agglomerative and Spectral Clustering in Speaker Diarization of Meetings Jordi Luque and Javier Hernando [Abstract]
14:20 - 14:45	Generalized Viterbi-based Models for Time-Series Segmentation Applied to Speaker Diarization Itshak Lapidot and Jean-Francois Bonastre [Abstract]
14:45 - 15:10	A Global Optimization Framework For Speaker Diarization Mickael Rouvier and Sylvain Meignier [Abstract]
15:10 - 15:35	Cisco’s Speaker Segmentation and Recognition System Sachin Kajarekar, Aparna Khare, Matthias Paulik, Neha Agrawal, Panchi Panchapagesan, Ananth Sankar and Satish Gannu [Abstract]

Session 6: Speaker Recognition – Channel Robustness
Tuesday 26 June 2012

16:00 - 16:25	Variance-Spectra based Normalization for I-vector Standard and Probabilistic Linear Discriminant Analysis Pierre-Michel Bousquet, Anthony Larcher, Driss Matrouf, Jean-Francois Bonastre and Oldrich Plchot [Abstract]
16:25 - 16:50	Utterance Partitioning with Acoustic Vector Resampling for I-Vector based Speaker Verification Wei RAO and Man-Wai MAK [Abstract]
16:50 - 17:15	Study on the Effects of Intrinsic Variation using i-Vectors in Text-Independent Speaker Verification Sheng Chen, Mingxing Xu, and Emlyn Pratt [Abstract]
17:15 - 17:40	Exploring the Impact of Advanced Front-End Processing on NIST Speaker Recognition Microphone Tasks William Campbell, Doug Sturim, Jonas Borgstrom, Robert Dunn, Alan McCree, Tom Quatieri and Doug Reynolds [Abstract]
17:40 - 18:05	Linear Prediction Modulation Filtering for Speaker Recognition of Reverberant Speech Bengt Borgstrom and Alan McCree [Abstract]

Session 7: Language Recognition Evaluation
Wednesday 27 June 2012

10:30 - 10:55	Evaluation of Spoken Language Recognition Technology Using Broadcast Speech: Performance and Challenges Luis J. Rodriguez-Fuentes, Amparo Varona, Mireia Diez, Mikel Penagarikano and German Bordel [Abstract]
10:55 - 11:20	New Resources for Recognition of Confusable Linguistic Varieties: The LRE11 Corpus Stephanie Strassel, Kevin Walker, Karen Jones, Dave Graff and Christopher Cieri [Abstract]
11:20 - 11:45	The MITLL NIST LRE 2011 Language Recognition System Elliot Singer, Pedro Torres-Carrasquillo, Douglas Reynolds, Alan McCree, Fred Richardson, Najim Dehak and Doug Sturim [Abstract]
11:45 - 12:10	Description and analysis of the Brno276 system for LRE2011 Niko Brummer, Sandro Cumani, Ondrej Glembek, Martin Karafiat, Pavel Matejka, Jan Pesan, Oldrich Plchot, Mehdi Soufifar, Edward de Villiers and Jan Cernocky [Abstract]
12:10 - 12:35	A Linguistic Data Acquisition Front-End for Language Recognition Evaluation Gang Liu, Chi Zhang and John Hansen [Abstract]

Session 8: Features for Speaker Recognition
Wednesday 27 June 2012

13:30 - 13:55	Feature Extraction Using 2-D Autoregressive Models For Speaker Recognition Sriram Ganapathy, Samuel Thomas and Hynek Hermansky [Abstract]
13:55 - 14:20	Regularization of All-Pole Models for Speaker Verification Under Additive Noise Cemal Hanilci, Tomi Kinnunen, Rahim Saeidi, Jouni Pohjalainen, Paavo Alku and Figen Ertas [Abstract]
14:20 - 14:45	Factor Analysis of Acoustic Features using a Mixture of Probabilistic Principal Component Analyzers for robust Speaker Verification Taufiq Hasan and John Hansen [Abstract]
14:45 - 15:10	Exemplar-based Sparse Representation and Sparse Discrimination for Noise Robust Speaker Identification Rahim Saeidi, Antti Hurmalainen, Tuomas Virtanen and David A. van Leeuwen [Abstract]
15:10 - 15:35	On the use of Asymmetric-shaped Tapers for Speaker Verification using I-vectors Md Jahangir Alam, Patrick Kenny and Douglas O'Shaughnessy [Abstract]

Session 9: Speaker Recognition Evaluation
Thursday 28 June 2012

10:00 - 10:25	The Effect of Target/Non-Target Age Difference on Speaker Recognition Performance George Doddington [Abstract]
10:25 - 10:50	Variational Bayes Logistic Regression as Regularized Fusion for NIST SRE 2010 Ville Hautamäki, Kong Aik Lee, Anthony Larcher, Tomi Kinnunen, Bin Ma and Haizhou Li [Abstract]
10:50 - 11:15	The 2011 BEST Speaker Recognition Interim Assessment Craig Greenberg, Alvin Martin and Mark Przybocki [Abstract]
11:15 - 11:40	The REPERE Challenge: finding people in a multimodal context Juliette Kahn, Olivier Galibert, Matthieu Carré, Aude Giraudel, Philippe Joly and Ludovic Quintard [Abstract]
11:40 - 12:05	The RATS Radio Traffic Collection System Kevin Walker and Stephanie Strassel [Abstract]

Session 10: Speaker Recognition – Application
Thursday 28 June 2012

13:00 - 13:25	Effects of Audio and ASR Quality on Cepstral and High-level Speaker Verification Systems Andreas Stolcke, Martin Graciarena and Luciana Ferrer [Abstract]
13:25 - 13:50	Audio Context Recognition in Variable Mobile Environments from Short Segments using Speaker and Language Recognizers Tomi Kinnunen, Rahim Saeidi, Jussi Leppaanen and Jukka P. Saarinen [Abstract]
13:50 - 14:15	Text Dependent Speaker Verification Using a Small Development Set Hagai Aronowitz [Abstract]
14:15 - 14:40	A Unified Approach for Audio Characterization and its Application to Speaker Recognition Luciana Ferrer, Lukas Burget, Oldrich Plchot and Nicolas Scheffer [Abstract]
14:40 - 15:05	Mean Shift Algorithm for Exponential Families with Applications to Speaker Clustering Themos Stafylakis, Vassilis Katsouros, Patrick Kenny and Pierre Dumouchel [Abstract]

Session 11: Language Recognition – Feature, Classifier and Fusion
Thursday 28 June 2012

15:30 - 15:55	Speaker Vectors from Subspace Gaussian Mixture Model as Complementary Features for Language Identification Oldrich Plchot, Martin Karafiat, Niko Brummer, Ondrej Glembek, Pavel Matejka, Edward de Villiers and Jan Cernocky [Abstract]
15:55 - 16:20	Complementary Combination in i-Vector Level for Language Recognition Zhi-Yi Li, Wei-Qiang Zhang, Liang He and Jia Liu [Abstract]
16:20 - 16:45	Bhattacharyya-based GMM-SVM System with Adaptive Relevance Factor for Pair Language Recognition Changhuai You, Haizhou Li, Eliathamby Ambikairajah, Kong Aik Lee and Bin Ma [Abstract]
16:45 - 17:10	Fusing Language Information from Diverse Data Sources for Phonotactic Language Recognition Mohamed Faouzi BenZeghiba, Jean-Luc Gauvain and Lori Lamel [Abstract]

Proceedings of Odyssey: The Speaker and Language Recognition Workshop
Odyssey 2012, Singapore

Published by Chinese and Oriental Languages Information Processing Society (COLIPS), Speaker and Language Characterization SIG

Odyssey 2012

The Speaker and Language Recognition Workshop

25 June – 28 June 2012, Singapore

Technical Program

Session 1: Speaker Recognition – Compact Representation Monday 25 June 2012

Session 2: Speaker Recognition – Generative modeling Monday 25 June 2012

Session 3: Forensic Speaker Recognition Monday 25 June 2012

Session 4: Neural Network for Speaker Recognition Tuesday 26 June 2012

Session 5: Speaker Diarization Tuesday 26 June 2012

Session 6: Speaker Recognition – Channel Robustness Tuesday 26 June 2012

Session 7: Language Recognition Evaluation Wednesday 27 June 2012

Session 8: Features for Speaker Recognition Wednesday 27 June 2012

Session 9: Speaker Recognition Evaluation Thursday 28 June 2012

Session 10: Speaker Recognition – Application Thursday 28 June 2012

Session 11: Language Recognition – Feature, Classifier and Fusion Thursday 28 June 2012

Session 1: Speaker Recognition – Compact Representation
Monday 25 June 2012

Session 2: Speaker Recognition – Generative modeling
Monday 25 June 2012

Session 3: Forensic Speaker Recognition
Monday 25 June 2012

Session 4: Neural Network for Speaker Recognition
Tuesday 26 June 2012

Session 5: Speaker Diarization
Tuesday 26 June 2012

Session 6: Speaker Recognition – Channel Robustness
Tuesday 26 June 2012

Session 7: Language Recognition Evaluation
Wednesday 27 June 2012

Session 8: Features for Speaker Recognition
Wednesday 27 June 2012

Session 9: Speaker Recognition Evaluation
Thursday 28 June 2012

Session 10: Speaker Recognition – Application
Thursday 28 June 2012

Session 11: Language Recognition – Feature, Classifier and Fusion
Thursday 28 June 2012