Мы используем файлы cookie.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.
Ngữ liệu tiếng nói
Подписчиков: 0, рейтинг: 0
Đối với nghĩa rộng hơn của chủ đề này, xem Ngữ liệu ngôn ngữ.
Ngữ liệu tiếng nói (hay còn gọi là ngữ liệu lời nói) là một cơ sở dữ liệu các tệp âm thanh giọng nói và văn bản phiên âm.
Trong công nghệ tiếng nói (speech technology), ngữ liệu tiếng nói được sử dụng, trong số nhiều thứ khác, để tạo mô hình âm thanh (acoustic model) (sau đó có thể dùng để nhận dạng tiếng nói hay cơ chế nhận dạng người nói). Trong ngôn ngữ học, ngữ liệu tiếng nói được dùng để làm nghiên cứu ngữ âm học, phân tích hội thoại, phương ngữ học (dialectology) và các lĩnh vực khác.
Tham khảo
Đọc thêm
- Edwards, Jane / Lampert, Martin (eds.) (1992): Talking Data – Transcription and Coding in Discourse Research. Hillsdale: Erlbaum.
- Leech, Geoffrey / Myers, Greg / Thomas, Jenny (eds.) (1995): Spoken English on Computer: Transcription, Markup and Application. Harlow: Longman.
Liên kết ngoài
- Santa Barbara Corpus of Spoken American English
- Buckeye Corpus The Buckeye Corpus of Conversational Speech
- Spoken Language Corpora at the Research Center on Multilingualism
- VoxForge – open source speech corpora
- OLAC: Open Language Archives Community
- BAS Bavarian Archive for Speech Signals
- ELRA: the European Language Resources Association
- Corpus of Political Speeches: Free access to political speeches by American and Chinese politicians, developed by Hong Kong Baptist University Library