Tài liệu này được viết ra nhằm tổng hợp các kiến thức cơ bản về công nghệ xử lý tiếng nói, tập trung vào tiếng nói Việt. Hi vọng sẽ mang tới được chút gì đó hữu ích tới cho người đọc.
Về nội dung, tài liệu bỏ qua lý thuyết mà tập trung vào thực hành.
Về quá trình viết, nội dung sẽ được cập nhật chỉnh sửa liên tục. Xin lỗi trước vì tạm thời cấu trúc sẽ lộn xộn, sẽ có nhiều phần thiếu sót, hoặc sai be sai bét. Không thể chờ cho đến lúc hoàn thiện do giới hạn về thời gian: Tôi vẫn phải hàng ngày đi làm công ăn lương. Mặt khác, nếu không bày ra chỗ công cộng sớm thì lại không có chút ràng buộc hay sức ép gì để tôi cố gắng làm việc: Tôi có thể một ngày thấy chán mà từ bỏ.
Ta sẽ bắt đầu bằng chương 1 mở đầu mô tả về cơ bản một hệ thống tiếng nói gồm những thành phần gì, hoạt động như thế nào. Sau đó các chương sau sẽ đi sâu vào từng vấn đề nhỏ trong xử lý tiếng nói với một số nghiên cứu, có kèm ví dụ, kết quả thực nghiệm và phân tích. Ở chương 2 là ví dụ về một số đặc tính cơ bản của tiếng nói. Chương tiếp theo 3 là vấn đề phát hiện tiếng nói. Chương kế tiếp 4 là một vấn đề thời sự nóng hổi về làm sao để xây dựng được hệ thống ghi lại lời nói như Google :D. Chương áp chót 5 trình bày sơ qua về bài toán xác định người nói ứng dụng trong bảo mật. Chương cuối 6 là một số kiến thức về hệ thống hỗ trợ con người luyện phát âm nhằm chữa hoặc cải thiện khả năng nói.
Mọi ý kiến đóng góp xin viết vào phần bình luận hoặc tốt hơn là gửi cho tôi về địa chỉ email.