TIÊU CHUẨN QUỐC GIA TCVN 11737-3:2016 (ISO 8253-3:2012) VỀ ÂM HỌC – PHƯƠNG PHÁP ĐO THÍNH LỰC – PHẦN 3: PHÉP ĐO THÍNH LỰC BẰNG GIỌNG NÓI
TCVN 11737-3:2016
ISO 8253-3:2012
ÂM HỌC – PHƯƠNG PHÁP ĐO THÍNH LỰC – PHẦN 3: PHÉP ĐO THÍNH LỰC BẰNG GIỌNG NÓI
Acoustics – Audiometric test methods – Part 3: Speech audiometry
Lời nói đầu
TCVN 11737-3:2016 hoàn toàn tương đương với ISO 8253-3:2012.
TCVN 11737-2:2016 do Ban kỹ thuật Tiêu chuẩn quốc gia TCVN/TC 43 Âm học biên soạn, Tổng cục Tiêu chuẩn Đo lường Chất lượng đề nghị, Bộ Khoa học và Công nghệ công bố.
Bộ tiêu chuẩn TCVN 11737 (ISO 8253), Âm học – Phương pháp đo thính lực gồm các tiêu chuẩn sau:
– TCVN 11737-1:2016 (ISO 8253-1:2010), Phần 1: Phép đo thính lực bằng âm đơn truyền qua xương và không khí;
– TCVN 11737-2:2016 (ISO 8253-2:2009), Phần 2: Phép đo thính lực trong trường âm với âm đơn và các tín hiệu thử dải hẹp;
– TCVN 11737-3:2016 (ISO 8253-3:2012), Phần 3: Phép đo thính lực bằng giọng nói.
Lời giới thiệu
Phép đo thính lực bằng giọng nói được sử dụng để đánh giá khả năng nghe liên quan đến đánh giá chẩn đoán và phục hồi chức năng thính lực.
Các kết quả của phép đo thính lực bằng giọng nói phụ thuộc vào chất giọng và phương pháp sử dụng. Tiêu chuẩn này quy định các điều kiện đối với chất giọng nhằm đảm bảo các yêu cầu tối thiểu về độ chụm và khả năng tương thích giữa các phép thử khác nhau có sử dụng các chất giọng khác nhau bao gồm cả các chất giọng theo các ngôn ngữ khác nhau. Tiêu chuẩn này cũng quy định các quy trình sử dụng khi thử nghiệm nhận dạng giọng nói.
ÂM HỌC – PHƯƠNG PHÁP ĐO THÍNH LỰC – PHẦN 3: PHÉP ĐO THÍNH LỰC BẰNG GIỌNG NÓI
Acoustics – Audiometric test methods – Part 3: Speech audiometry
1 Phạm vi áp dụng
Tiêu chuẩn này quy định các phương pháp cơ bản đối với các phép thử nhận dạng giọng nói cho các ứng dụng thính học.
Để đảm bảo các yêu cầu tối thiểu về độ chụm và khả năng tương thích giữa các quy trình thử khác nhau bao gồm các phép thử nhận dạng giọng nói theo các ngôn ngữ khác nhau, tiêu chuẩn này cũng quy định các yêu cầu về thành phần, xác nhận và đánh giá các chất giọng thử, và việc thực hiện các phép thử nhận dạng giọng nói. Tiêu chuẩn này không quy định nội dung của chất giọng vì tính đa dạng của ngôn ngữ.
Ngoài ra, tiêu chuẩn này còn quy định phương pháp xác định các giá trị quy chiếu và các yêu cầu phải đáp ứng khi thực hiện và cách thức thể hiện.
Tiêu chuẩn này quy định các quy trình và các yêu cầu đối với phép đo thính lực giọng nói với chất giọng thử được ghi lại, truyền qua không khí bằng tai nghe, hoặc từ loa đối với phép đo thính lực tại trường âm. Tiêu chuẩn này mô tả các phương pháp sử dụng tiếng ồn che phủ tai không tham gia thử hoặc sử dụng âm khác.
Một số các đối tượng thử, ví dụ trẻ em, có thể yêu cầu quy trình thử sửa đổi không được đề cập đến trong tiêu chuẩn này.
Các phép thử đặc biệt như các phép thử sử dụng để đánh giá khả năng nghe định hướng và nghe phức hợp không thuộc phạm vi áp dụng của tiêu chuẩn này.
2 Tài liệu viện dẫn
Các tài liệu viện dẫn sau là cần thiết cho việc áp dụng tiêu chuẩn này. Đối với các tài liệu viện dẫn ghi năm công bố thì áp dụng bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất, bao gồm cả các sửa đổi (nếu có).
TCVN 6965 (ISO 266), Âm học – Tần số ưu tiên.
TCVN 9595-3 (ISO/IEC Guide 98-3), Độ không đảm bảo đo – Hướng dẫn trình bày độ không đảm bảo đo (GUM:1995).
TCVN 11737-1 (ISO 8253-1), Âm học – Phương pháp đo thính lực – Phần 1: Phép đo thính lực bằng âm đơn truyền qua xương và không khí
TCVN 11737-2 (ISO 8253-2), Âm học – Phương pháp đo thính lực – Phần 2: Phép đo thính lực trong trường âm với âm đơn và các tín hiệu thử dải hẹp.
IEC 60645-1, Electroacoustics – Audiological equipment – Part 1: Pure-tone audiometers (Điện thanh – Thiết bị thính học – Phần 1: Âm kế đo âm đơn sắc).
IEC 60645-2:1993, Audiometers – Part 2: Equipment for speech audiometry (Thiết bị đo thính lực – Phần 2: Thiết bị dùng cho phép đo thính lực giọng nói).
IEC 61672-1, Electroacoustics – Sound level meters – Part 1: Specifications. (Điện thanh – Đồng hồ đo âm – Phần 1: Yêu cầu kỹ thuật).
3 Thuật ngữ và định nghĩa
Trong tiêu chuẩn này, áp dụng các định nghĩa và thuật ngữ nêu tại TCVN 11737-1 (ISO 8253-1) và TCVN 11737-2 (ISO 8253-2) và các thuật ngữ sau đây:
3.1
Tín hiệu giọng nói (speech signal)
Tín hiệu âm thanh mang các thông tin trong một ngôn ngữ nhất định.
CHÚ THÍCH: Một tín hiệu giọng nói có thể là một tín hiệu tiếng nói hoặc một tín hiệu âm mô phỏng một tín hiệu tiếng nói.
3.2
Dữ liệu thử (test item)
Từ đơn âm hoặc đa âm tiết đặc biệt hoặc logatom (âm tiết không có nghĩa), hoặc một câu, hoặc một phân đoạn giới hạn về thời gian của giọng nói kết nối, được sử dụng phù hợp theo các nguyên tắc xác định về cách thể hiện và cho điểm trong một quy trình đo thính lực bằng giọng nói.
CHÚ THÍCH: Cho điểm có thể phụ thuộc vào một dữ liệu thử hoàn chỉnh hoặc các phần của chúng mà được công nhận chính xác.
3.3
Chất giọng (speech material)
Toàn bộ các dữ liệu thử được sử dụng cho các phép thử nhận dạng giọng nói.
CHÚ THÍCH: Thông thường chất giọng được chia nhỏ thành một số danh mục thử.
3.4
Bộ chất giọng thử mở (open-set test material)
Bộ các dữ liệu thử trong đó số lượng các phản hồi khác nhau đối với từng dữ liệu thử là không giới hạn.
3.5
Bộ chất giọng thử đóng (closed-set test material)
Bộ các dữ liệu thử trong đó số lượng các phản hồi khác nhau đối với từng dữ liệu thử là có giới hạn.
3.6
Âm vị (phoneme)
Đơn vị nhỏ nhất của giọng nói có thể nhận biết được trong một ngôn ngữ tự nhiên nhất định.
3.7
Loại âm vị (phoneme class)
Sự chia nhỏ của âm vị cho thấy các đặc điểm tương đồng trong phương thức tạo nguyên âm cũng như trong các tính chất tín hiệu âm.
3.8
Âm tiết (syllable)
Một đoạn của giọng nói gồm một nguyên âm có hoặc không có một hoặc nhiều các phụ âm đi kèm ngay trước hoặc sau.
3.9
Sponđe (spondee)
Từ gồm hai âm tiết có trọng âm như nhau trên mỗi âm tiết.
3.10
Logatom (logatom)
Đơn vị âm tiết mà không có ý nghĩa bằng lời nói đối với người nghe
CHÚ THÍCH: thuật ngữ “logatom” đôi khi được gọi là “âm tiết không có nghĩa”.
3.11
Danh mục thử (test list)
Số lượng các dữ liệu thử được chọn lựa, được biểu thị và cho điểm như một đơn vị đơn lẻ.
3.12
Bộ dữ liệu thử (set of test items)
Số lượng các dữ liệu thử được chọn lựa từ danh mục thử.
3.13
Danh mục thử cân bằng về âm vị (phonemically balanced test list)
Danh mục thử có cùng một tỷ lệ như nhau của các âm vị khác nhau khi có mặt trong giao tiếp giọng nói bình thường của một ngôn ngữ nhất định.
3.14
Danh mục thử cân bằng về cảm nhận (perceptually balanced test list)
Danh mục thử có điểm nhận dạng giọng nói tương đương với sự thay đổi được giảm thiểu tại mức giọng nói quy định trong các điều kiện tương đương (cách thức thể hiện quy định và nhóm người nghe quy định).
CHÚ THÍCH: Thông thường nhóm người nghe quy định bao gồm những người có thính lực bình thường với độ tuổi từ 18 tuổi đến nhỏ hơn hoặc bằng 25 tuổi. Đối với các phép thử đặc biệt, các nhóm khác nhau (ví dụ, trẻ em có thính lực bình thường trong độ tuổi quy định) cũng có thể áp dụng.
3.15
Cụm từ mang (carrier phrase)
Câu hoặc cụm từ được lồng vào một dữ liệu thử sao cho sự nhận biết chính xác về dữ liệu thử không phụ thuộc vào ngữ cảnh hoặc ý nghĩa của câu hoặc cụm từ đó.
3.16
Bản ghi chuẩn của chất giọng (reference of recording of speech material)
Bản ghi chính (master recording)
Sự ghi rõ ràng thể hiện chất giọng và được sử dụng để xác nhận và ứng dụng chất giọng đó. Bản ghi được định nghĩa rõ ràng, trong đó trình bày chất giọng và cách dùng chúng trong xác nhận và ứng dụng.
3.17
Mức giọng nói (speech level)
Mức áp suất âm liên tục tương đương của chất giọng đo được trong bộ ghép âm tương ứng, thiết bị mô phỏng tai hoặc trong một trường âm, với tần số trọng số C phù hợp với IEC 61672-1.
CHÚ THÍCH: Đối với các danh mục thử giọng nói dựa trên các dữ liệu thử đơn lẻ được tách riêng bằng các khoảng thời gian yên lặng, tích phân không bao gồm các khoảng thời gian này. Với danh mục thử dựa trên các dữ liệu thử đơn lẻ với cụm từ mang, phép phân tích chỉ gồm các dữ liệu này. Trong phương pháp ghi số, các khoảng thời gian yên lặng có thể loại bỏ bằng cách cắt xén, thêm bớt. Cũng có thể thực hiện hiệu chính theo con số bằng cách xác định tổng thời gian của các dữ liệu thử và tổng các khoảng thời gian yên lặng.
3.18
Mức áp suất âm liên tục tương đương (equivalent continuous sound pressure level)
Lp,eqT
Mười lần logarit cơ số 10 của tỷ số giữa trung bình theo thời gian của bình phương áp suất âm, p, trong khoảng thời gian bắt đầu, T (bắt đầu tại t1 và kết thúc tại t2) với giá trị quy chiếu bình phương, po, tính theo đêxiben.
trong đó giá trị quy chiếu, po bằng 20 μPa.
CHÚ THÍCH: Do các giới hạn mang tính thực tế của các thiết bị đo, p2 luôn luôn được hiểu là bình phương trọng số tần số và áp suất âm có dải tần số giới hạn. Nếu một tần số trọng số Cụ thể như xác định tại IEC 61672-1 và/hoặc các dải tần số cụ thể được áp dụng, thì điều này phải được chỉ ra bằng các chỉ số dưới, ví dụ, Lp,A,10 s nghĩa là mức áp suất âm trung bình theo thời gian trọng số A trong 10 s.
[ISO/TR 2541[3], 2.3].
3.19
Mức ngưỡng phát hiện giọng nói (speech detection threshold level)
Đối với một đối tượng thử xác định, đối với một chất giọng xác định và cách truyền dẫn tín hiệu quy định, mức giọng nói mà tại đó nó được phát hiện (không nhất thiết phải hiểu) trong 50% các thử nghiệm.
3.20
Cho điểm nhận dạng giọng nói (speech recognition score)
Đối với một đối tượng thử xác định, đối với một chất giọng xác định và cách truyền dẫn tín hiệu quy định, và tại mức giọng nói quy định, phần trăm nhận dạng đúng các dữ liệu thử hoặc các dữ liệu có thể được cho điểm nếu phương pháp cho điểm không dựa trên toàn bộ các dữ liệu thử.
3.21
Cho điểm lớn nhất về nhận dạng giọng nói (maximum speech recognition score)
Đối với một đối tượng thử xác định, đối với một chất giọng xác định và cách truyền dẫn tín hiệu quy định, sẽ thu được sự cho điểm lớn nhất về nhận dạng giọng nói không kể đến mức giọng nói.
3.22
Mức ngưỡng nhận dạng giọng nói (speech recognition threshold level)
Đối với một đối tượng thử xác định, đối với một chất giọng xác định và cách truyền dẫn tín hiệu quy định, mức giọng nói thấp nhất hoặc tỷ số giọng nói và tiếng ồn mà tại đó cho điểm nhận dạng giọng nói bằng 50%.
CHÚ THÍCH: Ngưỡng nhận dạng giọng nói còn được gọi là “mức thu nhận giọng nói”.
3.23
Mức ngưỡng nhận dạng giọng nói quy chiếu (reference speech recognition threshold level)
Đối với chất giọng xác định và cách truyền dẫn tín hiệu quy định, giá trị trung bình của các mức ngưỡng nhận dạng giọng nói của một số lượng đủ lớn những người có thính lực bình thường, của cả hai giới tính, với độ tuổi giữa 18 tuổi đến và bằng 25 tuổi có chất giọng thử phù hợp.
3.24
Mức giọng nói tối ưu (optimum speech level)
Đối với đối tượng thử xác định, đối với chất giọng xác định và cách truyền dẫn tín hiệu quy định, mức giọng nói hoặc dải các mức giọng nói mà tại đó nhận được cho điểm lớn nhất về nhận dạng giọng nói.
3.25
Mức giọng nói bán tối ưu (half-optimum speech level)
Đối với một đối tượng thử xác định, đối với chất giọng xác định và cách truyền dẫn tín hiệu quy định, mức giọng nói mà tại đó nhận được một nửa của sự đánh giá lớn nhất về nhận dạng giọng nói.
3.26
Đường cong nhận dạng giọng nói (speech recognition curve)
Đối với một đối tượng thử xác định, đối với chất giọng xác định và cách truyền dẫn tín hiệu quy định, đường cong mô tả sự đánh giá nhận dạng giọng nói là hàm số của mức giọng nói.
3.27
Đường cong nhận dạng giọng nói quy chiếu (reference speech recognition curve)
Đối với chất giọng xác định và cách truyền dẫn tín hiệu quy định, đường cong mô tả đánh giá nhận dạng giọng nói trung bình là hàm số của mức giọng nói của một số lượng đủ lớn những người có thính lực bình thường, của cả hai giới tính, với độ tuổi từ 18 tuổi đến nhỏ hơn và bằng 25 tuổi mà có chất giọng thử phù hợp.
3.28
Mức nghe đối với giọng nói (hearing level for speech)
Đối với chất giọng xác định và cách truyền dẫn tín hiệu quy định, mức giọng nói trừ đi mức ngưỡng nhận dạng giọng nói quy chiếu phù hợp.
3.29
Âm xen vào (competing sound)
Âm thêm vào được phát ra trong quá trình tiến hành các phép thử nhận dạng giọng nói.
3.30
Mức áp suất âm xen vào (competing sound pressure level)
Mức áp suất âm liên tục tương đương của âm xen vào đo được trong bộ ghép âm thích hợp, thiết bị mô phỏng tai hoặc trong trường âm, với tần số trọng số C phù hợp với IEC 61672-1.
3.31
Sự chênh lệch về mức giữa giọng nói và tiếng ồn (speech-to-noise level difference)
Tỷ số giọng nói và tiếng ồn (speech-to-noise ratio)
SNR
Sự chênh lệch giữa mức của giọng nói và mức của âm xen vào.
3.32
Mức che phủ hiệu dụng đối với giọng nói (effective masking level for speech)
Mức che phủ âm xác định là bằng về số lượng với mức giọng nói nghe được với mức ngưỡng nhận dạng giọng nói đối với một tín hiệu giọng nói xác định có thể được tăng lên khi có âm che phủ.
3.33
Mức giọng nói thoải mái nhất (most comfortable level for speech)
Đối với một đối tượng thử xác định và cách truyền dẫn tín hiệu quy định, mức giọng nói mà tại đó âm lượng của tín hiệu giọng nói được đối tượng thử nghiệm đánh giá là thoải mái, phù hợp nhất.
3.34
Giọng nói liên thông (connected speech)
Giọng nói liên tục (running speech)
Giọng nói liên tục với ngữ điệu tự nhiên, gồm các câu liên tiếp với các kết nối hợp lý.
4 Các yêu cầu về ghi chất giọng
4.1 Các yêu cầu chung
Mỗi bản ghi chép bao gồm các tín hiệu sau:
a) chất giọng:
b) tín hiệu dùng để hiệu chuẩn thiết bị đối với phép đo thính lực giọng nói, của khoảng thời gian không ít hơn 60 s; tín hiệu hiệu chuẩn sẽ là tiếng ồn ngẫu nhiên trọng số, ví dụ, như quy định tại IEC 60645-2:1993, 13.1. Một dải tiếng ồn có tần số trung tâm tại 1 kHz và có độ rộng băng tần bằng một phần ba octa, hoặc một âm điều biến tần số tại 1 kHz và có độ rộng băng tần ít nhất bằng một phần ba octa – tín hiệu điều biến sẽ là hình sin hoặc tam giác với tốc độ lặp lại trong dải từ 4 Hz đến 20 Hz.
c) các tín hiệu để thử đáp ứng tần số của thiết bị sử dụng cho phép đo thính lực giọng nói bao gồm thiết bị phát lại và thiết bị ghi – các tín hiệu như vậy sẽ có khoảng thời gian không ít hơn 15 s và bao gồm các dải một phần ba octa của tiếng ồn trắng có tần số trung tâm tại các tần số một phần ba octa thường dùng phù hợp với ISO 266 trong dải từ 125 Hz đến 8000 Hz.
CHÚ THÍCH: Đối với chất giọng dựa trên cơ sở thời gian và/hoặc các trọng số tần số khác với mức áp suất âm tương đương trọng số C, các hệ số hiệu chính có thể được xác định mô tả sự chênh lệch liên quan đến mức áp suất âm tương đương trọng số C đối với mức giọng nói, mức tín hiệu hiệu chuẩn và mức tiếng ồn xen vào.
4.2 Ghi âm chuẩn
Một người nói phù hợp, nam hoặc nữ, có cách phát âm bình thường, rõ ràng không có tiếng địa phương. Người nói được hướng dẫn để duy trì sự rõ ràng, tốc độ tự nhiên, lực âm và tránh nhấn mạnh vào các từ khóa.
Một ghi âm chuẩn chủ yếu bao gồm các thành phần như quy định tại 4.1. Ghi âm chuẩn sẽ không được thay đổi. Tất cả các bản được thực hiện từ ghi âm chuẩn. Tất cả các thay đổi so với ghi âm chuẩn (ví dụ, bản ghi âm mới hoặc các thay đổi về mức hoặc phổ tần suất) yêu cầu sự đánh giá xác nhận mới (xem Điều 5).
Đối với phép đo thính lực giọng nói thực hiện trong môi trường ồn, ghi âm chuẩn cũng phải bao gồm tiếng ồn hoặc các tiếng ồn xen vào kèm theo, trên cùng kênh hoặc trên các kênh tách riêng.
4.3 Môi trường ghi âm
Phòng mà trong đó giọng nói được ghi âm sẽ phải đủ yên lặng để cung cấp tỷ số tín hiệu và tiếng ồn bằng ít nhất 40 dB và có thời gian âm vang nhỏ hơn 0,5 s tại bất kỳ tần số nào trong dải từ 125 Hz đến 8000 Hz.
4.4 Đáp ứng tần số của thiết bị ghi âm
Đáp ứng tần số của thiết bị ghi âm bao gồm micro phải bằng phẳng trong khoảng 2 dB trong dải từ 125 Hz đến 8000 Hz.
CHÚ THÍCH : Chất lượng ghi âm và thất thoát không đáng kể về chất lượng sau khi sử dụng lại nhiều lần làm cho việc ghi âm bằng số tốt hơn hẳn.
4.5 Khoảng thời gian giữa các dữ liệu thử liên tiếp
Các khoảng thời gian giữa các dữ liệu thử nghiệm liên tiếp phải được quy định và không đổi trong phạm vi ± 10%.
Đối với các từ thử đơn lẻ, khoảng thời gian không lớn hơn 4 s được khuyên dùng.
4.6 Các mức
4.6.1 Chất giọng
Mức ngưỡng chuẩn trung bình nhận dạng giọng nói của một bộ nhỏ nhất của các dữ liệu thử sử dụng tại mức áp suất âm xác định trước sẽ không được chênh nhau quá ± 1 dB so với trung bình của tất cả các dữ liệu thử trong danh mục kiểm tra. Mức ngưỡng chuẩn nhận dạng giọng nói của bất kỳ dữ liệu thử đơn lẻ nào không được chênh nhau quá ± 3 dB so với mức ngưỡng chuẩn trung bình nhận dạng giọng nói của tất cả các dữ liệu thử của danh mục kiểm tra. Mức ngưỡng chuẩn trung bình nhận dạng giọng nói của tất cả các danh mục thử sẽ không được khác ± 1 dB so với mức ngưỡng chuẩn trung bình nhận dạng giọng nói của tất cả các dữ liệu thử ghi được, xem Phụ lục D.
4.6.2 Tín hiệu hiệu chuẩn
Mức của tín hiệu hiệu chuẩn không được chênh nhau nhiều hơn ± 0,5 dB so với mức giọng nói trung bình của tất cả các dữ liệu thử của chất giọng cụ thể. Mức của tín hiệu hiệu chuẩn sẽ được đo, sử dụng cùng trọng số tần số như khi đo mức giọng nói.
4.7 Tỷ số tín hiệu và tiếng ồn
Mức của bất kỳ tiếng ồn nền cố hữu nào khi ghi âm phải thấp hơn ít nhất là 40 dB dưới mức tín hiệu hiệu chuẩn phù hợp với 4.6.2 như đo được sử dụng cùng trọng số tần số như khi đo mức giọng nói.
4.8 Cân bằng âm vị trên các dạng mục thử
Tất cả các danh mục thử của một chất giọng cụ thể phải là cân bằng về mặt âm vị.
Trong một vài trường hợp, có thể không đạt được sự cân bằng âm vị một cách hoàn hảo. Trong các trường hợp đó, các danh mục thử phải được cân bằng về âm vị dựa trên cơ sở các loại âm vị, tức là các âm hữu thanh và âm vô thanh (âm câm) bật và xát, các âm mũi, các nguyên âm dài và ngắn.
Sự phân phối các âm vị của chất giọng phải xấp xỉ như sự phân phối âm vị của ngôn ngữ thử, càng giống càng tốt. Các chất giọng gồm số lượng lớn các dữ liệu cho phép sự xấp xỉ gần hơn so với các chất giọng có số lượng nhỏ hơn. Trong một số trường hợp, khả năng đạt được sự xấp xỉ gần với phân phối âm vị là hạn chế, ví dụ, trong các phép thử sàng lọc hoặc các phép thử đối với trẻ em. Do chất giọng là hạn chế với số lượng nhỏ các dữ liệu thử tương ứng.
4.9 Cân bằng cảm nhận trên các dạng mục thử
Tất cả các danh mục thử của một chất giọng cụ thể phải là cân bằng về mặt cảm nhận, tức là, kết quả của phép thử nhận dạng giọng nói sẽ phải độc lập khi chọn lựa danh mục thử.
Các danh mục thử cân bằng về cảm nhận phải thỏa mãn các yêu cầu nêu tại 4.6.1. Các yêu cầu bổ sung đối với các danh mục thử cân bằng về cảm nhận được nêu sau đây.
Các đường cong nhận dạng giọng nói đối với tất cả các danh mục thử được xác định theo cách thức sao cho mức ngưỡng nhận dạng giọng nói có thể xác định được với độ không đảm bảo đo mở rộng không vượt quá 1 dB (độ rộng của khoảng tin cậy 95% không vượt quá 2 dB); xem Phụ lục E. Để đạt được điều này, các phép đo nhận dạng giọng nói tại các mức thể hiện khác nhau (hoặc các tỷ số giọng nói và tiếng ồn trong trường hợp phép thử nhận dạng giọng nói trong môi trường ồn) được thực hiện với ít nhất 10 người có thính lực bình thường có ngôn ngữ bản địa giống ngôn ngữ của chất giọng. Các phép đo nhận dạng giọng nói được thực hiện trong ngữ cảnh bình thường của tác nhân kích thích giọng nói (ví dụ, diễn đạt các câu khi sử dụng phép thử câu). Việc nhận dạng giọng nói của từng dữ liệu thử sẽ được cho điểm và phân tích độc lập (ví dụ, đánh giá các từ riêng biệt của các câu).
Để đạt được độ không đảm bảo đo mở rộng không vượt quá 1 dB, cần rất cẩn thận để làm giảm các nguồn gây ra độ không đảm bảo đo tiềm ẩn.
Để làm tăng lên khả năng đồng nhất về tri giác của chất giọng, các sự chênh lệch về nhận dạng giọng nói giữa các dữ liệu giọng nói cụ thể có thể được giảm thiểu (xem Phụ lục D).
5 Đánh giá xác nhận các bản ghi âm chất giọng
5.1 Quy định chung
Để đánh giá xác nhận, sử dụng thiết bị đáp ứng các yêu cầu của IEC 60645-2:1993, từ Điều 6 đến Điều 17, loại A, A-E, B hoặc B-E. Tiến hành thử cho một bên tai. Nếu sử dụng thiết bị loại A-E hoặc B-E, thì việc đánh giá bao gồm cả hai tai nghe đã hiệu chính và chưa hiệu chính đối với đầu ra tương đương trường tự do. Chi sử dụng các danh mục kiểm tra hoàn chỉnh.
CHÚ THÍCH: Việc sử dụng thiết bị loại A-E hoặc B-E sẽ cho các kết quả giống nhau đối với cả tai nghe hai tai và nghe qua loa do đáp ứng tần số tương đương trường tự do.
5.2 Xác định đường cong nhận dạng giọng nói
Đường cong nhận dạng giọng nói quy chiếu đối với từng chất giọng và cách thức truyền âm được xác định bằng cách thực hiện các phép thử nhận dạng giọng nói sử dụng một nhóm đủ lớn (ít nhất 25 người) những người có thính lực bình thường mà ngôn ngữ đầu tiên của họ là ngôn ngữ của chất giọng. Các yêu cầu tối thiểu đối với các mức ngưỡng nghe âm đơn của các đối tượng thử sẽ được xác định bằng kiểm tra đánh giá của phòng thử nghiệm.
Nên sử dụng tiêu chí sau dựa trên cơ sở biểu đồ âm đơn được sử dụng: các mức ngưỡng nghe của các đối tượng thử sẽ là tại hoặc dưới 10 dB tại các tần số 250 Hz, 500 Hz, 750 Hz, 1000 Hz, 1500 Hz, 2000 Hz, 3000 Hz, 4000 Hz, 6000 Hz, và 8000 Hz. Tại tần số lớn nhất trong hai tần số mức ngưỡng nghe có thể là 15 dB.
Nếu phép thử nhận dạng giọng nói được thực hiện đối với trẻ em, thì đường cong nhận dạng giọng nói quy chiếu được xác định sử dụng một nhóm đủ lớn (ít nhất 25) trẻ em có thính lực bình thường có cùng độ tuổi theo chất giọng sẽ sử dụng.
Nếu phép thử nhận dạng giọng nói được thực hiện trong môi trường im lặng, thì đường cong nhận dạng giọng nói được xác định trong môi trường im lặng.
Nếu phép thử nhận dạng giọng nói sẽ được sử dụng cùng tiếng ồn xen vào, thì đường cong nhận dạng giọng nói được xác định có sử dụng tiếng ồn này. Nếu phép thử nhận dạng giọng nói được sử dụng với nhiều tiếng ồn khác nhau, thì đường cong nhận dạng giọng nói được xác định có sử dụng từng loại tiếng ồn cụ thể.
Nếu đường cong nhận dạng giọng nói trình bày ở dạng bảng mô tả mối tương quan giữa mức giọng nói (hoặc chênh lệch của mức giọng nói và tiếng ồn) và đánh giá nhận dạng giọng nói. Các mức giọng nói (hoặc các chênh lệch của mức giọng nói và tiếng ồn) mà được yêu cầu để đạt được các điểm nhận dạng giọng nói 30%, 40%, 50%, 60%, 70%, 80%, và 90% được quy định. Các giá trị này có thể được tính toán có sử dụng phép nội suy tương ứng giữa các số liệu đã đo được.
Nếu nhóm người cho thấy có sự biến thiên lớn trong các kết quả nhận dạng giọng nói (ví dụ đối với trẻ em), có thể chứng minh rằng cần phải đo đường cong nhận dạng giọng nói có sử dụng số lượng lớn người thử.
Nếu có khó khăn để xác định được toàn bộ đường cong nhận dạng giọng nói quy chiếu từ 0% đến 100%, thì đảm bảo rằng đường cong nhận dạng giọng nói được xác định trong dải đang quan tâm. Nếu phép thử nhận dạng giọng nói được sử dụng để xác định các mức ngưỡng nghe nhận dạng giọng nói, thì đường cong nhận dạng giọng nói quy chiếu được đo tại các giá trị gần mức ngưỡng nhận dạng giọng nói (bao gồm các giá trị chặn trên và chặn dưới giá trị này) sử dụng đủ số lượng các phép đo. Nếu phép thử nhận dạng giọng nói được sử dụng để xác định mức giọng nói tối ưu, thì đường cong nhận dạng giọng nói quy chiếu phải được đo tại các giá trị từ 50% (hoặc nhỏ hơn) đến các giá trị gần 100% sử dụng đủ số lượng các phép đo.
5.3 Xác định tương đương về tri giác của các danh mục thử
Sự tương đương về mặt tri giác của các danh mục thử của các chất giọng đáp ứng các yêu cầu tại 4.9 được xác định bằng cách thực hiện các phép thử nhận dạng giọng nói sử dụng một nhóm đủ lớn (ít nhất 10) những người có thính lực bình thường như nêu tại 5.2.
Nếu phép thử nhận dạng giọng nói được sử dụng trong môi trường im lặng, thì sự tương đương về tri giác của các danh mục thử sẽ được xác định trong môi trường im lặng.
Nếu phép thử nhận dạng giọng nói được thực hiện trong môi trường tiếng ồn xen vào, thì sự tương đương về tri giác của các danh mục thử sẽ được xác định trong môi trường tiếng ồn này. Nếu phép thử này sẽ được thực hiện với các tiếng ồn khác nhau, thì sự tương đương về tri giác của các danh mục thử sẽ được xác định sử dụng từng tiếng ồn cụ thể.
Nếu nhóm người cho thấy có sự biến thiên lớn trong các kết quả nhận dạng giọng nói (ví dụ đối với trẻ em), thì cần thiết phải xác định sự tương đương về tri giác của đường cong của các danh mục thử sử dụng số lượng lớn người thử.
Sự tương đương về tri giác của các danh mục thử nghiệm được xác định theo các khoảng độ tin cậy trung bình 95% của các danh mục thử. Nếu phép thử nhận dạng giọng nói sẽ dùng để xác định các mức ngưỡng nhận dạng giọng nói, thì sự cân bằng của các danh mục kiểm tra sẽ được xác định theo các khoảng độ tin cậy trung bình 95% của các danh mục thử của mức ngưỡng nhận dạng giọng nói khi sử dụng các danh mục thử khác nhau cho cùng một nhóm các đối tượng thử. Nếu phép thử nhận dạng giọng nói sẽ dùng để xác định mức giọng nói tối ưu, thì sự cân bằng của các danh mục kiểm tra sẽ được xác định theo các khoảng độ tin cậy trung bình 95% đối với các danh mục thử của các điểm nhận dạng giọng nói 50%, 60%, 70%, 80%, và 90% khi sử dụng các danh mục thử khác nhau cho cùng một nhóm các đối tượng thử.
Điều này có nghĩa là bình phương các chênh lệch giữa các kết quả khi sử dụng các danh mục kiểm tra khác nhau sẽ phải lấy trung bình trên những người nghe. Căn bậc hai của giá trị này nhân với 2 sẽ thu được giá trị mong muốn.
5.4 Xác định độ lặp lại của các kết quả (độ tin cậy trung bình của phép thử-thử lại)
Độ lặp lại của kết quả phép thử nhận dạng giọng nói được định lượng theo độ tin cậy trung bình của phép thử-thử lại đối với một đối tượng. Nói chung, sử dụng các danh mục thử khác nhau trong phép thử và phép thử lại vì các phản hồi của phép thử ban đầu được đối tượng thử nhớ có thể ảnh hưởng kết quả của phép thử lại.
Nếu phép thử nhận dạng giọng nói được thực hiện trong môi trường im lặng, thì xác định độ tin cậy trung bình của phép thử-thử lại trong môi trường im lặng.
Nếu phép thử nhận dạng giọng nói được thực hiện trong môi trường tiếng ồn cạnh tranh, thì xác định độ tin cậy trung bình của phép thử-thử lại trong môi trường tiếng ồn này. Nếu phép thử nhận dạng giọng nói được thực hiện trong môi trường có các tiếng ồn khác nhau, thì xác định độ tin cậy trung bình của phép thử-thử lại trong môi trường của từng tiếng ồn cụ thể.
Độ tin cậy trung bình (phép thử so với phép thử lại) sẽ được xác định theo các khoảng độ tin cậy trung bình 95% trên các đối tượng.
Điều này có nghĩa là bình phương các chênh lệch giữa các kết quả của các phép đo thử và thử lại sẽ phải lấy trung bình trên những người nghe. Căn bậc hai của giá trị này nhân với 2 sẽ thu được giá trị mong muốn.
Nếu phép thử nhận dạng giọng nói sẽ dùng để xác định các mức ngưỡng nhận dạng giọng nói, thì độ tin cậy được đánh giá đối với mức ngưỡng nhận dạng giọng nói này. Nếu phép thử nhận dạng giọng nói sẽ dùng để xác định mức giọng nói tối ưu, thì độ tin cậy của phép thử-thử lại được xác định đối với các điểm nhận dạng giọng nói 50%, 60%, 70%, 80%, và 90%.
5.5 Lập hồ sơ
Mỗi bản ghi âm sẽ được cung cấp cùng hồ sơ gồm các thông tin sau:
a) bản in chất giọng đã ghi được;
b) (các) phương pháp ghi, ví dụ, theo câu, từ, từ khóa, hoặc âm vị;
c) các đường cong nhận dạng giọng nói quy chiếu như quy định tại 5.2 cho từng phương pháp ghi, bản gốc của các đường cong quy chiếu và chi tiết về các điều kiện đo (ví dụ, số lượng, tuổi, phạm vi và dải các mức ngưỡng nghe của các đối tượng thử và loại thiết bị sử dụng cho từng phép đo thính lực giọng nói cũng như việc bố trí các loa đối với tiếng ồn xen vào, nếu có);
d) độ lặp lại của các kết quả như quy định tại 5.4;
e) khoảng thời gian, phổ tần số và các mức liên quan với mức giọng nói của tín hiệu hiệu chuẩn và các tín hiệu khác ghi được đối với mục đích các tiêu chuẩn kỹ thuật thực hiện thử phù hợp với 4.1 b) và c);
f) mức tín hiệu hiệu chuẩn và mối tương quan của nó với mức ngưỡng nhận dạng giọng nói quy chiếu;
g) các khoảng thời gian giữa các hạng mục thử liên tiếp;
h) các đặc tính của bất kỳ tín hiệu tiếng ồn xen vào nào kèm theo.
6 Các yêu cầu đối với phép đo thính lực giọng nói
Phép đo thính lực giọng nói được thực hiện với sự sử dụng thiết bị đáp ứng các yêu cầu của IEC 60645-2. Tiến hành thử nghiệm bằng các tai nghe một tai hoặc hai tai, nhờ bộ kích rung xương, hoặc trong trường âm. Mức của tín hiệu giọng nói được biểu thị theo mức giọng nói hoặc mức nghe đối với giọng nói cho từng chất giọng thử cụ thể đang được sử dụng.
7 Các mức áp suất âm xung quanh trong phòng thử đối với phép đo thính lực giọng nói
Các mức áp suất âm của môi trường xung quanh trong phòng thử không được che phủ các tín hiệu giọng nói. Các yêu cầu về các mức áp suất âm của môi trường xung quanh trong phòng thử phụ thuộc vào phương thức truyền các tín hiệu giọng nói, tức là qua tai nghe, bộ kích rung xương hoặc loa.
CHÚ THÍCH: Các yêu cầu về tiếng ồn xung quanh trong quá trình đo thính lực giọng nói có thể kém nghiêm ngặt hơn các yêu cầu đối với phép đo thính lực ngưỡng âm đơn. Nếu một phòng thử là thích hợp đối với phép thử thính lực âm đơn giảm xuống một giá trị mức nghe nhất định trên toàn bộ dải tần số, thì phòng này cũng có thể dùng được cho phép đo thính lực giọng nói theo cùng một phương thức truyền các tín hiệu thử đối với các mức tín hiệu giảm xuống đến cùng các giá trị mức nghe. Các mức áp suất âm xung quanh lớn nhất cho phép đối với phép đo thính lực âm đơn trong dải tần số từ 125 Hz đến 8000 Hz, được quy định tại TCVN 11737-1 (ISO 8253-1) sử dụng các tai nghe và các máy dung xương và tại TCVN 11737-2 (ISO 8253-2) đối với phép đo thính lực tại trường âm.
8 Phép đo thính lực giọng nói tại trường âm
Phép đo thính lực giọng nói tại trường âm có thể thực hiện khi có hoặc không có âm xen vào được tái tạo riêng cho mục đích của phép thử này.
Vị trí được khuyến nghị cho loa giọng nói là tại phía trước người nghe và tại góc tới bằng 0°. Nếu các kết quả thính lực giọng nói từ một đối tượng thử riêng lẻ khi đem so sánh với mức ngưỡng nhận dạng giọng nói quy chiếu hoặc đường cong nhận dạng giọng nói quy chiếu, thì vị trí của loa sẽ là giống hệt như vị trí đã sử dụng để xác định các giá trị quy chiếu.
Nếu tiếng ồn được phát ra làm âm xen vào với tín hiệu giọng nói, thì các vị trí được khuyến nghị của các loa tiếng ồn được quy định tại 15.2.
Ghi lại loại trường âm (tự do, gần như tự do và khuếch tán), như quy định tại TCVN 11737-2 (ISO 8253-2), và vị trí điểm quy chiếu.
9 Chuẩn bị và hướng dẫn đối tượng thử
9.1 Quy định chung
Nói chung, giả sử là phép đo thính lực âm đơn được thực hiện trước phép đo thính lực giọng nói.
9.2 Chuẩn bị đối tượng thử
Việc mới tiếp xúc với tiếng ồn có thể gây sự tăng tạm thời các mức ngưỡng nghe. Vì vậy, cần tránh tiếp xúc lâu với tiếng ồn trước khi tiến hành thử nghiệm thính lực, hoặc sẽ phải có ghi chú đầy đủ. Để tránh được các sai lỗi do sự gắng sức quá mức về thể lực, các đối tượng thử nên có mặt tối thiểu 5 min trước khi bắt đầu thử.
Thông thường, phép thử thính lực sẽ được kiểm tra soi tai trước do nhân viên có trình độ thực hiện. Nếu thấy có ráy trong các ống tai ngoài, thì lấy ráy đi và như vậy phép đo thính lực sẽ chậm lại sau một khoảng thời gian nhất định. Tai cũng phải được kiểm tra về khả năng tắc vòi nhĩ và có thể can thiệp, nếu cần.
CHÚ THÍCH: Có thể là các yêu cầu đối với một người có trình độ được các cơ quan quản lý nhà nước hoặc các tổ chức phù hợp quy định.
Khả năng của đối tượng thử để hiểu được chất giọng thử phải được thiết lập trước khi tiến hành thử. Nếu phản ứng với chất giọng thử là nói được, thì điều này được thiết lập là đối tượng thử sẽ có thể mô phỏng được chất giọng thử này.
9.3 Hướng dẫn các đối tượng thử
Để nhận được các kết quả thử tin cậy, điều quan trọng là các hướng dẫn liên quan phải được nêu rõ ràng trong các quy trình thử và đối tượng thử phải hiểu đầy đủ và thấu đáo.
Các hướng dẫn phải được diễn đạt bằng ngôn ngữ phù hợp cho người nghe. Chúng phụ thuộc vào loại phép thử giọng nói được thực hiện. Thông thường các hướng dẫn chỉ rõ:
a) tai nào được tiến hành thử đầu tiên;
b) loại các dữ liệu của phép thử và nhiệm vụ phản hồi;
c) cần phản hồi khi nghe thấy âm trong bất kỳ tai nào, kể cả khi âm có thể yếu;
d) cần phản hồi ngay khi nghe được dữ liệu thử;
e) nếu phản hồi là nói, thì nhắc lại rõ ràng dữ liệu thử đã nghe được, ngay cả khi không chắc chắn là đã nghe được chính xác. Chỉ cho phép có một câu phản hồi cho một dữ liệu thử.
Các đối tượng thử cũng được hướng dẫn để tránh làm các di chuyển không cần thiết để loại trừ được tiếng ồn không liên quan. Sau khi hướng dẫn xong, thử nghiệm viên xác minh rằng họ đã thực sự hiểu. Nếu còn thấy có vần đề nghi ngờ, phải tiến hành hướng dẫn lại. Đối tượng thử cũng được thông báo rằng họ có thể dừng cuộc thử nếu cảm thấy không thoải mái.
10 Cách phản hồi của đối tượng thử
Phản hồi của đối tượng thử được có thể ở dạng trả lời bằng nói nhưng cũng có thể được viết hoặc chỉ ra nhờ một bàn phím. Khi thử nghiệm viên không ở cùng phòng với đối tượng thử và phản hồi của đối tượng thử đối với tín hiệu giọng nói là nói ra, thì sử dụng hệ thống ghi âm-phát lại.
Việc nói phản hồi của đối tượng thử phải được thử nghiệm viên hiểu được rõ ràng. Nếu không, phải sử dụng phương thức phản hồi khác. Thử nghiệm viên phải quen thuộc với ngôn ngữ này và có khả năng nghe tương thích với sự hiểu các phản hồi của đối tượng thử.
Khoảng thời gian giữa các dữ liệu thử phụ thuộc vào chất giọng thử, mục đích của thử giọng nói và dạng phản hồi của đối tượng thử phải được ghi lại.
Cho điểm nhận dạng giọng nói của đối tượng thử có thể phụ thuộc vào khoảng thời gian giữa các dữ liệu thử. Để làm cho các kết quả thử so sánh được với các giá trị quy chiếu tương ứng, sử dụng các khoảng thời gian giống như các khoảng thời gian sử dụng trong quá trình xác định các giá trị quy chiếu.
11 Xác định mức ngưỡng phát hiện giọng nói
11.1 Trong phép thử nghiệm một tai, bắt đầu với tai được cho là nhạy hơn.
11.2 Khi xác định ngưỡng phát hiện giọng nói, giọng nói được kết nối ưu tiên như tín hiệu giọng nói. Để mỗi dữ liệu thử sẽ là một phần của khoảng thời gian 1 s đến 2 s, được kiểm soát nhờ nút dừng của thiết bị thử. Dữ liệu đầu tiên được truyền tại mức đủ cao để gợi lên một câu phản hồi xác định; ví dụ, 30 dB trên mức trung bình của các mức ngưỡng nghe âm đơn của đối tượng thử tại 500 Hz, 1000 Hz, và 2000 Hz.
11.3 Giảm mức này theo các bước bằng 20 dB cho đến khi đối tượng thử không phản hồi.
11.4 Tăng mức này lên bằng tín hiệu giọng nói theo các bước bằng 5 dB và thể hiện một dữ liệu thử đối với từng mức cho đến khi đối tượng thử phản hồi.
11.5 Sau khi có phản hồi, tăng mức thử lên 10 dB và sau đó bắt đầu tiến lên bước khác sử dụng các bước bằng 5 dB cho đến khi đối tượng thử phản hồi.
11.6 Lặp lại bước 11.5 cho đến khi có ba phản hồi tại cùng một mức trong số tối đa năm lần tăng. Mức này là mức ngưỡng phát hiện giọng nói.
11.7 Nếu có số phản hồi ít hơn ba trong số năm lần tăng nhận được tại cùng mức, thì đưa ra dữ liệu thử tại mức 10 dB cao hơn thức của câu phản hồi cuối cùng. Sau đó lặp lại các bước từ 11.4 đến 11.6.
11.8 Thực hiện tiếp tục với tai kia nếu có yêu cầu.
11.9 Giả sử là có một phiên bản rút gọn của phương pháp tăng dần này để tạo ra các kết quả gần như tương đương và có thể thích hợp trong một số trường hợp. Trong phiên bản rút gọn này, tiếp tục thử nghiệm theo bước 11.6 cho đến khi có ít nhất hai phản hồi xuất hiện tại cùng một mức trong số tối đa ba lần tăng lên.
12 Xác định mức ngưỡng nhận dạng giọng nói
12.1 Quy định chung
12.1.1 Sử dụng toàn bộ các danh mục thử. Dữ liệu thử có thể là một từ đơn, một mệnh đề hoặc một câu. Một câu có thể được cho điểm là đúng hết hoặc theo các từ khóa được nhắc lại đúng.
Các quy trình giảm được mô tả tại 12.2 và 12.3 được dựa trên hai cỡ bước đã sử dụng rộng rãi: 5 dB và 2 dB. Hai quy trình khác nhau được mô tả:
a) quy trình giảm sử dụng các bước 5 dB;
b) quy trình giảm khác sử dụng các bước 2 dB hoặc 5 dB.
Các quy trình được dự kiến là tạo ra các kết quả có thể so sánh được. Tuy nhiên, không có sẵn bằng chứng thực nghiệm về điều này tại thời điểm công bố. Các quy trình là giống nhau từ 12.1.2 đến 12.1.4. Sau đó tiếp tục quy trình giảm, sử dụng các bước 5 dB theo 12.2 và tiếp tục một quy trình khác theo 12.3.
Tại 12.4 và 12.5 mô tả hai phương pháp thử thích nghi, một là dựa trên cỡ bước không đổi và phương pháp kia dựa trên các cỡ bước thay đổi.
12.1.2 Trong thử nghiệm một tai, bắt đầu từ tai được cho là nhạy hơn.
12.1.3 Đối tượng thử phải làm quen với nhiệm vụ của mình trước khi xác định ngưỡng bằng cách phát nhiều các dữ liệu thử tại mức đủ cao để nghe rõ. Mức nghe của giọng nói bằng 20 dB đến 30 dB trên giá trị trung bình của các mức ngưỡng nghe âm đơn của đối tượng thử tại 500 Hz, 1000 Hz, và 2000 Hz là thường được khuyến nghị.
12.1.4 Giảm mức giọng nói theo các bước 5 dB, truyền ít nhất hai dữ liệu thử đối với từng mức, cho đến khi đối tượng thử không phản hồi đúng các dữ liệu thử. Tiếp tục tiến hành theo 12.2 đến 12.3.
12.2 Quy trình giảm sử dụng các bước 5 dB
12.2.1 Truyền một bộ các dữ liệu thử tại mức mà đối tượng thử đã ngừng trả lời đúng theo 12.1.3 và ghi lại số lượng các câu phản hồi đúng. Bộ dữ liệu thử này bao gồm ít nhất 10 hạng mục.
12.2.2 Nếu đối tượng thử cho điểm được ít nhất 50% đối với bộ các dữ liệu thử, thì giảm mức theo các bước bằng 5 dB và truyền một bộ mới các dữ liệu thử đối với từng mức cho đến khi đối tượng thử đạt được ít hơn 50% trên bộ các dữ liệu thử. Thông thường một mức cho thấy đạt được cao hơn 50% một chút và mức thấp hơn tiếp theo thì nhỏ hơn 50% một chút. Nếu đối tượng thử ghi được ít hơn 50% trên một bộ dữ liệu thử, thì tăng mức theo các bước bằng 5 dB và truyền một bộ mới các dữ liệu thử đối với từng mức cho đến khi đối tượng thử cho điểm được nhiều hơn 50% trên một bộ dữ liệu thử.
12.2.3 Mức ngưỡng nhận dạng giọng nói cho một tai là giá trị số nguyên của các mức tương ứng với số điểm đúng 50% như tính toán bằng phép ngoại suy tuyến tính giữa mức thấp nhất mà đã cho kết quả hơn 50% các phản hồi đúng và mức cao nhất mà đã cho kết quả nhỏ hơn 50% các phản hồi đúng. Nếu số điểm chính xác bằng 50% tại một mức giọng nói, thì mức đó là đại diện cho ngưỡng nhận dạng giọng nói.
12.3 Quy trình giảm khác
12.3.1 Khi một dữ liệu thử nghiệm không đạt, thì thử lại lần thứ hai tại cùng mức. Tiếp tục quy trình giảm này theo các bước bằng 10 dB cho đến khi đạt được mức mà tại đó hai dữ liệu thử liên tiếp không đạt tại cùng mức đó.
12.3.2 Tăng mức giọng nói theo 10 dB. Điều này xác định mức bắt đầu giọng nói, Ls.
12.3.3 Truyền hai dữ liệu thử tại mức bắt đầu giọng nói này và tại từng mức giảm 2 dB liên tiếp nếu sử dụng độ lớn của bước là 2 dB. Đối với độ lớn của bước là 5 dB thì xem 12.3.6.
12.3.4 Tiếp tục quá trình này nếu ít nhất năm trong số sáu dữ liệu thử đầu tiên được nhắc lại một cách chính xác. Nếu không đáp ứng tiêu chí này, thì tăng mức bắt đầu giọng nói từ 4 dB đến 10 dB.
12.3.5 Chấm dứt các loạt giảm dần này khi đối tượng thử phản hồi sai năm trong sáu dữ liệu thử cuối cùng đã phát.
12.3.6 Nếu sử dụng cỡ bước là 5 dB, thì phát năm dữ liệu thử tại mỗi mức và dừng phép thử khi tất cả các dữ liệu thử tại một mức đơn được nhận dạng không đúng.
12.3.7 Tính các mức ngưỡng nhận dạng giọng nói, T, theo đêxiben, theo Công thức sau:
Trong đó:
Ls là mức bắt đầu giọng nói, tính theo đêxiben, theo 12.3.2;
r là tổng số các phản hồi đúng đã cho từ mức bắt đầu giọng nói, tính theo đêxiben, theo 12.3.2
đến khi dừng theo 12.3.5 hoặc 12.3.6;
d là cỡ bước, tính theo đêxiben;
n là số lượng các dữ liệu thử trên một mức.
12.4 Quy trình thích nghi sử dụng các cỡ bước cố định
12.4.1 Dưới đây là ví dụ về một quy trình thích nghi sử dụng cỡ bước cố định dựa trên sự nhận dạng mức giọng nói khi 50% các dữ liệu thử được nhận dạng đúng. Khi sử dụng các phương pháp khác, ví dụ để xác định mức giọng nói mà tương ứng với phần trăm nhận dạng đúng các dữ liệu thử khác 50%, thì các chênh lệch sẽ được quy định rõ ràng.
12.4.2 Trong quá trình thử một bên tai, bắt đầu từ tai có độ nhạy cao hơn.
12.4.3 Đối tượng thử phải được làm quen với nhiệm vụ trước khi xác định ngưỡng bằng cách truyền các dữ liệu thử tại một mức đủ cao để nghe thấy rõ. Mức nghe của giọng nói là 20 dB đến 30 dB trên giá trị trung bình của các mức ngưỡng nghe âm đơn của đối tượng thử tại 500 Hz, 1000 Hz, và 2000 Hz là khuyến nghị chung.
12.4.4 Giảm mức giọng nói theo các bước 5 dB, truyền từng dữ liệu thử trên từng mức, cho đến khi đối tượng thử không còn phản hồi đúng với dữ liệu thử. Tiếp tục thực hiện theo 12.4.5 hoặc 12.5.
12.4.5 Tăng mức thử theo bước 2 dB và truyền dữ liệu thử đầu tiên của danh mục thử mới.
12.4.6 Tiếp tục thực hiện theo 12.4.7 đến 12.4.9 đối với các từ đơn hoặc các câu hoàn thiện như các dữ liệu thử. Đối với sự cho điểm dựa trên các từ khóa trong các câu, thì tiến hành theo các bước 12.4.10 đến 12.4.12.
12.4.7 Nếu người nghe có khả năng nhắc lại một cách chính xác, thì giảm mức thử theo bước 2 dB. Nếu không thì tăng mức thử theo bước 2 dB. Truyền dữ liệu thử khác.
12.4.8 Lặp lại 12.4.6 đối với tất cả các dữ liệu thử còn lại của danh mục thử.
12.4.9 Bỏ hai dữ liệu thử đầu tiên, lấy trung bình các mức truyền của các dữ liệu còn lại của danh mục thử. Giá trị trung bình này là ngưỡng nhận dạng giọng nói.
12.4.10 Nếu người nghe có khả năng nhắc lại một cách chính xác hơn một nửa các từ khóa, thì giảm mức thử theo bước 2 dB. Nếu số lượng các từ khóa được nhắc lại đúng là ít hơn một nửa, thì tăng mức thử theo bước 2 dB. Nếu số lượng các từ khóa được nhắc lại đúng là chính xác bằng một nửa, thì giữ nguyên mức giọng nói không đổi và truyền một câu thử khác.
12.4.11 Lặp lại 12.4.10 đối với tất cả các câu thử còn lại của danh mục thử.
12.4.12 Bỏ hai câu thử đầu tiên, lấy trung bình các mức truyền của các câu còn lại của danh mục thử. Giá trị trung bình này là ngưỡng nhận dạng giọng nói.
12.5 Quy trình thích nghi khác
Có thể hợp lý nếu sử dụng nguyên tắc thích nghi khác với quy trình nêu tại 12.4. Trong các trường hợp như vậy, các giá trị quy chiếu cũng như độ tin cậy của các phép thử-thử lại của quy trình thích nghi kết hợp với chất giọng sẽ được xác định, sử dụng một nhóm đủ lớn những người có thính lực bình thường như nêu tại 5.1. Các dữ kiện cài đặt của quy trình thích nghi (cỡ bước, cho điểm theo từ hoặc cho điểm theo câu, với mục đích dễ hiểu và các thay đổi khác so với quy trình mô tả tại 12.4) phải được xác định.
13 Xác định các cho điểm nhận dạng giọng nói
Nếu các điểm nhận dạng giọng nói được xác định tại nhiều hơn một mức (ví dụ, để xác định đường cong nhận dạng giọng nói), các dữ liệu thử phải được nhắc lại trong cùng một cuộc thử. Các điểm luôn luôn dựa trên sự truyền đạt một danh mục thử toàn bộ.
Nếu trước phép thử không thực hiện phép xác định ngưỡng nhận dạng giọng nói, thì đối tượng thử phải được làm quen với nhiệm vụ trước phép xác định một điểm bằng cách truyền đạt một số lượng các dữ liệu thử tại mức đủ cao để nghe rõ. Thông thường, mức nghe đối với giọng nói bằng 30 dB đến 40 dB trên giá trị trung bình của các mức ngưỡng nghe âm đơn tại 500 Hz, 1000 Hz, và 2000 Hz là một lựa chọn đúng.
Cài đặt thiết bị đo thính lực về mức giọng nói theo yêu cầu và truyền đạt một danh mục thử toàn bộ tại từng mức.
a) Để xác định điểm tối đa nhận dạng giọng nói, điểm đầu tiên thường được xác định tại mức giọng nói bằng 25 dB hoặc 30 dB trên mức ngưỡng nhận dạng giọng nói. Sau đó tăng mức này theo các bước 5 dB hoặc 10 dB cho đến khi nhận được điểm lớn nhất hoặc đối tượng thử báo cáo là mệt hoặc không thoải mái. Nếu điểm giảm đi tại các mức cao hơn (hiệu ứng qua dốc), thì tiếp tục phép thử tại các mức thấp hơn.
b) Để xác định số điểm nhận dạng giọng nói tại mức to thoải mái nhất, mức thử phải được lựa chọn bằng cách trình bày liên tục một tín hiệu giọng nói cùng loại với tín hiệu được sử dụng cho phép thử thực tế. Hướng dẫn đối tượng để báo cáo về mức to (ví dụ: quá nhỏ, thoải mái, to, quá to). Thông thường mức giữa quá to và quá nhỏ là lựa chọn ban đầu tốt cho mức thoải mái nhất.
c) Để xác định một nửa-mức giọng nói tối ưu, điểm nhận dạng giọng nói lớn nhất đầu tiên phải được xác định. Giảm mức này theo các bước 5 dB hoặc 10 dB và tiến hành toàn bộ danh mục thử trên từng mức cho đến khi một mức tạo ra một điểm trên nửa số điểm lớn nhất và mức thấp hơn tiếp theo tạo ra một điểm dưới nửa số điểm lớn nhất. Xác định giá trị số nguyên của nửa- mức giọng nói tối ưu theo phương pháp nội suy tuyến tính giữa hai mức thử sau cùng.
Biểu thị điểm nhận được theo phần trăm và ghi lại mức mà tại đó đã đạt được.
14 Che phủ tai đối bên
Để tránh nghe được các tín hiệu giọng nói trong tai không tham gia thử trong quá trình đo thính lực giọng nói một bên tai, điều này có thể cần áp dụng tiếng ồn che phủ truyền qua không khí cho tai không tham gia thử. IEC 60645-2 quy định các điều kiện chuẩn đối với loại tiếng ồn che phủ. Mức che phủ hiệu dụng đối với giọng nói bằng che phủ âm có phổ tần số nhất định và mức áp suất âm phụ thuộc vào các đặc tính của tín hiệu giọng nói. Vì vậy, nói chung không xác định được các mức che phủ hiệu dụng hợp lệ.
Sử dụng che phủ trong phép thử truyền qua không khí nếu mức tín hiệu giọng nói, được biểu thị là mức nghe đối với giọng nói, vượt quá bằng 40 dB hoặc lớn hơn trung bình của các mức ngưỡng nghe truyền qua xương đối với hai trong số các tần số 500 Hz, 1000 Hz, và 2000 Hz của tai đối bên cho thấy các mức ngưỡng nghe thấp nhất.
Mức che phủ tối thiểu đối với thử truyền qua không khí LM, biểu thị theo mức che phủ hiệu dụng, sẽ là:
LM = Lt – 40dB + (LAmin -LBmin)
Trong đó:
Lt là mức giọng nói, biểu thị là mức nghe của giọng nói;
LAmin là mức ngưỡng âm đơn trung bình truyền qua không khí của tai được che phủ tại hai trong số các tần số 500 Hz, 1000 Hz, và 2000 Hz có các mức ngưỡng nghe thấp nhất, biểu thị là mức nghe;
LBmin là mức ngưỡng nghe âm đơn trung bình truyền qua xương của tai được che phủ tại hai trong số các tần số 500 Hz, 1000 Hz, và 2000 Hz có các mức ngưỡng nghe thấp nhất, biểu thị là mức nghe.
Trong một số trường hợp, mức che phủ có thể được tăng lên để đảm bảo sự che phủ đủ cho tai không tham gia thử.
15 Phép đo thính lực giọng nói với âm xen vào
15.1 Loại âm xen vào
Tiếng ồn ngẫu nhiên không điều biến trọng số tần số A theo IEC 60645-2 có thể được sử dụng làm âm xen vào. Nếu một âm được điều biến hoặc tiếng ồn khác hoặc âm xen vào được sử dụng, thì các đặc tính của nó sẽ được xác định. Khi các âm xen vào khác với các âm kể trên bao gồm trong bản ghi âm quy chiếu được sử dụng thì không có các giá trị quy chiếu giá trị tồn tại. Xem Phụ lục B.
CHÚ THÍCH: Có thể sử dụng các âm xen vào sử dụng các bản ghi âm giọng nói con người, ví dụ nhiều giọng nói ầm ĩ (tiếng ồn tại tiệc cocktail) hoặc giọng nói kết nối từ loa đơn lẻ. Với các loại tiếng ồn như vậy, có thể xuất hiện sự biến thiên lớn trong các kết quả thử so với tiếng ồn trọng số ngầu nhiên.
15.2 Truyền âm xen vào
Trong thử nghiệm tai nghe, âm xen vào được truyền bằng chính các tai nghe sử dụng cho tín hiệu giọng nói thử. Trong phép đo thính lực tại trường âm, vị trí của tất cả các loa khi sử dụng đều được quy định. Vị trí khuyến nghị của loa giọng nói là phía trước người nghe tại góc tới là 0°. Nhận dạng giọng nói với âm xen vào trong trường âm có thể bị ảnh hưởng bởi các đặc tính âm học của phòng thử và vì thế có thể yêu cầu các dữ liệu chuẩn đối với từng môi trường thử cụ thể.
Âm xen vào nên phát qua hai loa bố trí đối xứng tại các góc tới bằng ± 45°. Âm xen vào nếu được phát qua hai hoặc nhiều loa phải không được kết hợp.
15.3 Các mức giọng nói và âm xen vào
Các mức giọng nói và âm xen vào có thể đo được như quy định tại điều 3.17 và 3.30. Mức giọng nói khuyến nghị là 65 dB, nó gần như tương ứng với mức giọng nói bình thường khi trò chuyện, nếu sử dụng các mức giọng nói khác, thì cần công bố rõ ràng. Mức của âm xen vào có thể không đổi hoặc thay đổi. Nếu là không đổi, thì mức tiếng ồn bằng 60 dB được khuyến nghị. Nếu thay đổi thì mức này sẽ thay đổi theo các bước bằng hoặc nhỏ hơn 5 dB.
15.4 Quy trình thử
15.4.1 Quy định chung
Có thể thực hiện phép thử để xác định điểm nhận dạng giọng nói tại một hoặc nhiều tỷ số giọng nói và tiếng ồn cố định hoặc để xác định tỷ số giọng nói và tiếng ồn tại ngưỡng nhận dạng giọng nói.
15.4.2 Điểm nhận dạng giọng nói tại tỷ số giọng nói và tiếng ồn cố định
15.4.2.1 Cài đặt thiết bị đo thính lực về mức giọng nói theo yêu cầu.
15.4.2.2 Cho đối tượng thử làm quen với nhiệm vụ bằng cài đặt mức âm xen vào thấp (ví dụ, tại 20 dB dưới mức giọng nói) và truyền một số lượng các dữ liệu thử mà nghe được rõ ràng.
15.4.2.3 Cài đặt mức âm xen vào về mức theo yêu cầu cho phép thử và tiến hành toàn bộ danh mục thử. Tính toán các điểm theo phần trăm.
15.4.3 Ngưỡng nhận dạng giọng nói với âm xen vào
15.4.3.1 Quy định chung
15.4.3.1.1 Trong các quy trình đã mô tả, việc tăng mức của âm xen vào có thể thay thế bằng việc giảm mức của tín hiệu giọng nói và ngược lại. Kết quả thử có thể bị ảnh hưởng bởi cách chọn khác nhau.
Các quy trình khác được mô tả để xác định tỷ số giọng nói và tiếng ồn mà tạo ra ngưỡng nhận dạng giọng nói tại mức giọng nói hoặc mức âm xen vào xác định. Chúng được dự kiến là cho các kết quả so sánh được. Tuy nhiên, đối với điều này vẫn chưa có sẵn bằng chứng thực nghiệm. Các quy trình là giống hệt nhau từ 15.4.3.1.2 đến 15.4.3.1.3. Sau đó, quy trình để giảm tỷ số giọng nói và tiếng ồn sử dụng các bước 5 dB sẽ tiếp tục tại 15.4.3.2 và quy trình thay thế khác sẽ tiếp tục tại 15.4.3.3.
15.4.3.1.2 Tiếp tục các bước 15.4.2.1 và 15.4.2.2.
15.4.3.1.3 Tăng mức âm xen vào theo các bước bằng hoặc nhỏ hơn 5 dB, và truyền ít nhất hai dữ liệu thử tại từng mức cho đến khi đối tượng thử nhận dạng không đúng một dữ liệu thử.
15.4.3.2 Quy trình để tăng tỷ số giọng nói và tiếng ồn sử dụng các bước 5 dB
15.4.3.2.1 Truyền một bộ các dữ liệu thử tại tỷ số giọng nói và tiếng ồn này và ghi lại số lượng các dữ liệu thử được nhận dạng đúng. Một bộ gồm ít nhất 10 dữ liệu thử.
15.4.3.2.2 Nếu đối tượng thử cho điểm đúng được ít nhất 50% của bộ các dữ liệu thử, thì tăng mức âm xen vào theo các bước bằng hoặc nhỏ hơn 5 dB và phát một bộ dữ liệu thử mới trên từng tỷ số giọng nói và tiếng ồn cho đến khi khối tượng thử đánh giá được ít hơn 50% trên một bộ các dữ liệu thử. Xác định tỷ số giọng nói và tiếng ồn tại ngưỡng nhận dạng giọng nói theo phương pháp nội suy tuyến tính giữa mức thấp nhất mà đã đánh giá được hơn 50% đúng và mức cao nhất mà đã đánh giá được ít hơn 50% đúng. Nếu đánh giá đúng được 50% tại tỷ số giọng nói và tiếng ồn này thì tỷ số này là biểu thị ngưỡng nhận dạng giọng nói.
15.4.3.3 Quy trình khác để giảm tỷ số giọng nói và tiếng ồn
15.4.3.3.1 Khi một dữ liệu thử bị nhầm, thì phát dữ liệu thứ hai với cùng mức âm xen vào. Tiếp tục thực hiện quá trình này theo bước tăng lên bằng 10 dB cho đến khi âm xen vào đạt được đến một mức mà tại đó hai dữ liệu thử lên tiếp bị bỏ lỡ tại cùng một mức.
15.4.3.3.2 Giảm mức âm xen vào 10 dB. Điều này xác định mức bắt đầu của âm xen vào, LN,S.
15.4.3.3.3 Phát hai dữ liệu thử tại mức bắt đầu này và tại mỗi bậc liên tiếp 2 dB nếu sử dụng cỡ bước bằng 2 dB. Đối với cỡ bước bằng 5 dB, xem 15.4.3.3.6.
15.4.3.3.4 Tiếp tục quá trình này nếu có ít nhất năm trong số sáu dữ liệu thử đầu tiên được nhắc lại đúng. Nếu không đáp ứng tiêu chí này thì giảm mức bắt đầu theo các bước từ 4 dB đến 10 dB.
15.4.3.3.5 Chuỗi giảm tỷ số giọng nói và tiếng ồn (tăng mức âm xen vào) sẽ dừng lại khi đối tượng thử phản hồi sai năm trong số sáu dữ liệu thử cuối cùng đã phát ra.
15.4.3.3.6 Nếu sử dụng cỡ bước bằng 5 dB, thì trên mỗi mức sẽ phát năm dữ liệu thử và phép thử dừng lại khi tất cả các dữ liệu thử tại một mức đơn lẻ không được nhận dạng đúng.
15.4.3.3.7 Đối với mức giọng nói đã chọn, tính mức áp suất âm của âm xen vào tại đó 50% các dữ liệu thử có thể được nhận dạng đúng theo công thức sau:
Trong đó:
LN,SRT là mức âm xen vào, tính theo đêxiben, đối với 50% điểm nhận dạng giọng nói đúng:
LN,S là mức bắt đầu của âm xen vào, tính theo đêxiben, theo 15.4.3.3.2;
d là cỡ bước, tính theo đêxiben;
r là tổng số các câu phản hồi đúng lấy từ mức bắt đầu theo 15.4.3.3.3 đến khi dừng theo 15.4.3.3.5 hoặc 15.4.3.3.6.
n là tổng số các dữ liệu thử trên một bước.
Biểu thị kết quả theo chênh lệch giữa mức giọng nói sử dụng và LN,SRT.
16 Hình thức trình bày của biểu đồ thính lực giọng nói
Khi sự biểu thị các kết quả của phép đo thính lực giọng nói theo dạng đồ thị được sử dụng, sẽ cho thấy điểm đánh giá nhận dạng giọng nói theo phần trăm dọc theo trục tung, và mức giọng nói, tính bằng đêxiben, hoặc mức nghe giọng nói, tính bằng đêxiben, hoặc tỷ số giọng nói và tiếng ồn, tính bằng đêxiben, dọc theo trục hoành. Tỷ số thang đo cần phải bằng 20% tương ứng 10 dB. Báo cáo về loại chất giọng và bất kỳ tiếng ồn xen vào đã sử dụng.
Biểu đồ thính lực của giọng nói phải bao gồm đường cong nhận dạng giọng nói quy chiếu tương ứng với chất giọng thực tế đã sử dụng.
17 Độ không đảm bảo đo
Độ không đảm bảo đo của các điểm đánh giá nhận dạng giọng nói được xác định theo bất kỳ quy trình nào quy định trong tiêu chuẩn này phụ thuộc vào nhiều thông số sau:
a) tính năng của thiết bị đo thính lực đã sử dụng:
b) loại bộ chuyển đổi và đầu nối của nó đã được thử nghiệm viên sử dụng:
c) chất giọng đã sử dụng:
d) quy trình thử đã sử dụng;
e) các điều kiện về môi trường thử, đặc biệt môi trường xung quanh;
f) trình độ và kinh nghiệm của thử nghiệm viên;
g) sự hợp tác của đối tượng thử và độ tin cậy của các phản hồi;
h) việc sử dụng tiếng ồn che phủ không tối ưu.
Do sự phức tạp của quá trình đo bao gồm cả hành vi ứng xử của con người của cả đối tượng thử và thử nghiệm viên, điều này gần như không thể biểu thị độ không đảm bảo trong một con số đơn lẻ có giá trị một cách chung chung.
Tuy nhiên, sự đánh giá chi tiết về độ không đảm bảo sẽ cung cấp các thông tin hữu ích về độ tin cậy của các kết quả của phép đo thính lực và tạo ra một sự đánh giá ước lượng đủ về về độ không đảm bảo trong hầu hết các ứng dụng.
Độ không đảm bảo của các phép đo phù hợp theo tiêu chuẩn này sẽ được đánh giá phù hợp theo TCVN 9595-3 (ISO/IEC Guide 98-3). Nếu báo cáo thì sẽ nêu độ không đảm bảo mở rộng cùng hệ số phủ tương ứng đối với xác suất bao phủ bằng 95%, như xác định tại TCVN 9595-3 (ISO/IEC Guide 98-3). Hướng dẫn xác định độ không đảm bảo mở rộng được nêu tại Phụ lục E.
18 Bảo dưỡng và hiệu chuẩn thiết bị
18.1 Quy định chung
Việc hiệu chuẩn đúng thiết bị đo thính lực là rất quan trọng đối với các kết quả tin cậy. Để đảm bảo điều này, khuyến nghị sơ đồ sau gồm ba giai đoạn của các quy trình kiểm tra và hiệu chuẩn:
– Giai đoạn A: kiểm tra hàng ngày và các phép thử về mức nghe;
– Giai đoạn B: các phép kiểm tra điện thanh định kỳ;
– Giai đoạn C: các phép hiệu chuẩn cơ bản.
18.2 Các khoảng thời gian giữa các phép thử
Các khoảng thời gian được khuyến nghị mà tại đó thực hiện các phép thử cần thiết khác nhau chỉ là hướng dẫn. Điều này nên được tuân thủ trừ khi hoặc cho đến khi có bằng chứng rằng một khoảng thời gian khác có thể thích hợp.
Các phép thử giai đoạn A nên được thực hiện hàng ngày trước khi sử dụng thiết bị. Các phép thử xác định các mức áp suất âm tại điểm quy chiếu tại nơi thử trường âm nên được thực hiện tại các khoảng thời gian không quá ba tháng và bổ sung thêm bất kỳ khi nào có các thay đổi đối với cơ sở thử nghiệm, ví dụ, sau khi di dời các đồ đạc trong nhà. Các phép thử điện thanh định kỳ, giai đoạn B, phải được thực hiện tại các khoảng thời gian từ 3 tháng đến 6 tháng, cho dù có thể chấp nhận các khoảng thời gian khác nhau theo kinh nghiệm đối với từng thiết bị và cách sử dụng, miễn là các phép thử của giai đoạn A được áp dụng đều đặn và cẩn thận. Tuy nhiên, không được vượt quá các khoảng thời gian một năm.
Phép thử hiệu chuẩn, giai đoạn C, không nhất thiết phải sử dụng trên cơ sở hàng ngày nếu các phép thử của giai đoạn A và giai đoạn B được thực hiện đều đặn. Phép thử giai đoạn C chỉ bắt buộc khi thiết bị bị trục trặc nghiêm trọng hoặc xuất hiện sai lỗi hoặc khi sau một thời gian dài sử dụng, có thể nghi ngờ thiết bị có thể không còn thực hiện được đầy đủ các yêu cầu kỹ thuật. Nên đưa thiết bị vào phép thử giai đoạn C tại các khoảng thời gian không quá 5 năm.
18.3 Giai đoạn A: Kiểm tra hàng ngày và các phép thử nghe
18.3.1 Mục đích của việc kiểm tra hàng ngày là để thiết bị vận hành tốt nhất có thể và để việc hiệu chuẩn thiết bị không có thay đổi đáng kể. Các điều kiện tiếng ồn xung quanh trong suốt quá trình thử được so sánh với các điều kiện đúng thực khi thiết bị đang trong quá trình sử dụng bình thường.
Quy trình thử được quy định tại 18.3.2 đến 18.3.9.
18.3.2 Kiểm tra và làm sạch thiết bị cũng như tất cả các phụ kiện. Kiểm tra các miếng đệm tai nghe, phích cắm và các dây dẫn về các dấu hiệu bị mòn và hỏng hóc. Các bộ phận bị hỏng hoặc lòng lẻo phải được thay thế.
18.3.3 Bật thiết bị và để một thời gian làm nóng thiết bị theo khuyến nghị hoặc ít nhất 5 min. Thực hiện các quy trình cài đặt theo quy định của nhà sản xuất. Đảm bảo là số seri của bộ chuyển đổi tương ứng với số seri của thiết bị.
18.3.4 Nếu tiến hành thử trong trường âm, thì đảm bảo là điểm quy chiếu là tại vị trí đúng và được nhận dạng rõ ràng.
18.3.5 Kiểm tra đầu ra của phép đo thính lực là xấp xỉ đúng và các mức tiếng ồn xung quanh là bình thường và có thể chấp nhận khi có người nghe các tín hiệu thử giọng nói mức-thấp. Mỗi lần tiến hành thử thì tốt nhất là cùng một người và người này có các mức ngưỡng nghe tốt đã biết trong dải bình thường. Phép thử được thực hiện với tất cả các bộ chuyển đổi có đầu ra phù hợp.
18.3.6 Nghe chất giọng thử tại mức cao hơn (ví dụ, tại mức nghe đối với giọng nói bằng 60 dB đến 70 dB) trên tất cả các chức năng thích hợp và với tất cả các tín hiệu thử sẵn có. Nghe về chức năng hoạt động tốt, đặc biệt về không có sự méo âm và không bị tiếng ồn xen vào.
18.3.7 Nghe tại các mức thấp và đảm bảo rằng không có tiếng “o o” hoặc tiếng ồn hoặc bất kỳ âm không mong muốn nào phát ra từ thiết bị tại vị trí của đối tượng thử.
18.3.8 Kiểm tra về các bộ giảm âm làm giảm các tín hiệu trên toàn bộ dải đo.
18.3.9 Đảm bảo rằng hệ thống ghi âm-phát lại và các mạch giám sát hoạt động tốt.
18.4 Giai đoạn B: Các phép thử điện thanh định kỳ
Các phép thử điện thanh bao gồm các kết quả đo và so sánh sau đây:
a) đáp ứng tần số đối với thiết bị bao gồm tất cả các bộ chuyển đổi có đầu ra phù hợp như quy định tại IEC 60645-2;
b) các mức đầu ra của các bộ chuyển đổi như quy định tại IEC 60645-2;
c) các bước của bộ suy giảm (trên một phần đáng kể của dải đo) phù hợp với IEC 60645-1;
d) sự méo sóng hài phù hợp với IEC 60645-2;
e) các mức tiếng ồn che phủ phù hợp với IEC 60645-2;
f) lực băng buộc đầu của các bộ chuyển đổi.
Ngoài ra, phải thực hiện phép kiểm tra giai đoạn A hàng ngày.
18.5 Giai đoạn C: Các phép thử hiệu chuẩn cơ bản
Việc hiệu chuẩn cơ bản đảm bảo rằng thiết bị đo thính lực, trường âm, và các mức tiếng ồn xung quanh đáp ứng tất cả các yêu cầu kỹ thuật liên quan tại IEC 60645-2 và tại tiêu chuẩn này.
Phụ lục A
(tham khảo)
Ví dụ về các chất giọng
A.1 Khái quát
Chất giọng có thể chia thành các cấp loại khác nhau. Phụ lục này liệt kê một số các ví dụ về chất giọng đối với các cấp loại này. Do có số lượng lớn các chất giọng, nên không thể đưa ra một danh mục trọn vẹn.
A.2 Ví dụ về các chất giọng thuộc bộ-mở
Ví dụ về các chất giọng thuộc bộ-mở được nêu tại Tài liệu tham khảo [12] – [15] và [30].
A.3 Ví dụ về các chất giọng thuộc bộ-đóng
Ví dụ về các chất giọng thuộc bộ-đóng được nêu tại Tài liệu tham khảo [16] – [18] và [29],
A.4 Ví dụ về các phép thử của câu thuộc bộ-mở
Ví dụ về các chất giọng câu thuộc bộ-mở được nêu tại Tài liệu tham khảo [19] – [24] và [28],
A.5 Ví dụ về các phép thử của câu thuộc bộ-đóng
Ví dụ về các chất giọng câu thuộc bộ-đóng được nêu tại Tài liệu tham khảo [25] – [27],
Phụ lục B
(tham khảo)
Các ví dụ về các điều kiện của âm xen vào
B.1 Quy định chung
Nếu (các) âm xen vào là gồm cả trong bản ghi âm chuẩn, trong đó có sẵn các giá trị chuẩn về nhận dạng giọng nói, thì những âm thanh đó là ưu tiên.
B.2 Các tiếng ồn không-điều biến
Loại âm xen vào này cho thấy không có hoặc chỉ một lượng rất nhỏ của các điều biến biên độ. Trong nhiều trường hợp, các tiếng ồn này đại diện cho phổ trung bình trong thời gian dài của chất giọng thuộc phép thử nhận dạng giọng nói. Thông thường loại tiếng ồn này tạo ra độ tin cậy cao của phép thử-thử lại mức ngưỡng nhận dạng giọng nói. Tuy nhiên, các chênh lệch giữa các mức ngưỡng nhận dạng giọng nói đối với các mức độ khác nhau của sự mất thính lực là tương đối nhỏ. Các ví dụ điển hình là tiếng ồn CCITT (TTU-T Khuyến nghị G.227[8]; đặc tính tần số điện thoại) hoặc tiếng ồn ICRA1 (Tài liệu tham khảo [31]) đại diện phổ trung bình giọng nói được tính trung bình cho các ngôn ngữ khác nhau.
B.3 Các tiếng ồn điều biến
Các âm này cho thấy các điều biến biên độ tương tự như những người nói đơn lẻ hoặc các nhóm một số người nói. Ví dụ là tiếng ồn ICRA5 (Tài liệu tham khảo [32]) đại diện phổ trung bình dài hạn của tiếng và khoảng thời gian một người nói xen vào. Các điều biến biên độ là độc lập trong ba kênh tần số khác nhau. Phiên bản sửa đổi của ICRA5-250 (Tài liệu tham khảo [32]) cho thấy khoảng thời gian được thay đổi theo các lần tạm dừng được giới hạn còn 250 ms. Thông thường, loại tiếng ồn này gây ra các chênh lệch lớn hơn giữa các mức ngưỡng nhận dạng giọng nói đối với các mức độ khác nhau của sự mất thính lực so với các tiếng ồn không điều biến. Tiếng ồn tương tự là tiếng ồn được mô tả trong Tài liệu tham khảo [32], trong tiếng ồn này các điều biến biên độ là giống nhau đối với tất cả các tần số.
B.4 Các tiếng ồn nhiễu
Loại âm xen vào này gồm một hoặc nhiều người nói chồng chéo. Các loại tiếng ồn này cho thấy các mức độ khác nhau của sự điều biến và các mức độ khác nhau của sự che phủ thông tin.
Tất cả các loại khác nhau của các tín hiệu xen vào (các tiếng tranh cãi, giọng nói liên tục, các tiếng ồn nhiễu được tạo thành từ một vài người, v.v..) có thể đưa vào các phép thử nhận dạng giọng nói cũng như trong tiếng ồn.
Sự phát truyền âm thanh xen vào có thể khác nhau theo cách phát truyền. Trong điều kiện đóng cửa, tiếng ồn bắt đầu từ một vài mili giây (ví dụ, 500 ms) trước khi bắt đầu có giọng nói và kết thúc một vài mili giây sau khi hết nói. Trong điều kiện liên tục, âm thanh xen vào được phát ra trong toàn bộ quy trình thử.
Do các tín hiệu xen vào khác nhau gây ra các giá trị chuẩn nhận dạng giọng nói khác nhau và các độ tin cậy của phép thử-thử lại tiếng ồn xen vào phải được báo cáo trong biểu đồ âm của giọng nói (xem Điều 16).
Phụ lục C
(tham khảo)
Các kết quả điển hình
C.1 Các đường cong nhận dạng giọng nói chuẩn điển hình
Các dữ liệu thuộc các câu của Gottingen được lấy làm ví dụ (Tài liệu tham khảo [20]). Chất giọng được dựa trên cơ sở 20 danh mục kiểm tra, mỗi danh mục có 10 câu, và được thử nghiệm trên 12 đối tượng có sức nghe bình thường. Điểm đánh giá nhận dạng giọng nói (giữa 0% và 100%), R, được tính như sau:
Trong đó
L là mức giọng nói trong yên lặng hoặc SNR trong tiếng ồn xen vào;
L50 là ngưỡng nhận dạng giọng nói, tính theo đêxiben (50% đúng).
CHÚ THÍCH: Đối với các phép thử không có tiếng ồn xen vào: L50 = 20 dB. Đối với các phép thử có giọng nói mô phỏng tiếng ồn không điều biến, thì tỷ số giọng nói và tiếng ồn là L50 = – 6 dB.
S là độ dốc của đường cong nhận dạng tính bằng % / dB tại L50, và
SS = 11%/ dB trong im lặng;
SS = 19% / dB trong môi trường có tiếng ồn.
Hình C.1 cho thấy đường cong quy chiếu điển hình về nhận dạng giọng nói sử dụng các câu của Gottingen trong tiếng ồn xen vào.
CHÚ DẪN
y tỷ lệ với các từ đúng
x tỷ số giọng nói và tiếng ồn
Hình C.1 – Đường cong nhận dạng giọng nói quy chiếu điển hình sử dụng các câu của Gottingen trong tiếng ồn xen vào
CHÚ THÍCH: Các ký hiệu tại – 4 dB và – 8 dB SNR biểu thị các đánh giá cho điểm về độ rõ đối với từng danh mục trong số 20 danh mục được lấy trung bình trên các đối tượng thử. Vạch sai số tại – 6 dB biểu thị độ lệch chuẩn của ngưỡng nhận dạng giọng nói của danh mục cụ thể.
C.2 Các mức ngưỡng nhận dạng giọng nói điển hình
Bảng C.1 trình bày các mức ngưỡng nhận dạng giọng nói điển hình mang lại sử dụng một số các phép thử nhận dạng giọng nói nêu tại Phụ lục A đối với những người nghe có thính lực bình thường.
Bảng C.1 – Các mức ngưỡng nhận dạng giọng nói điển hình
Loại chất giọng thử |
Tài liệu tham khảo |
Cho điểm |
Mức ngưỡng nhận dạng giọng nói đối với những người nghe có thính lực bình thường |
Bộ các câu mở trong yên lặng |
[20] |
Các từ |
20 dB |
Bộ các câu mở trong tiếng ồn |
[20] |
Các từ |
SNR: – 6 dB |
Bộ các câu mở trong tiếng ồn |
[19] |
Các từ |
SNR: – 5dB |
Bộ các câu mở trong tiếng ồn |
[19] |
Toàn bộ câu |
SNR: – 3 dB |
Bộ các câu mở trong tiếng ồn |
[23] |
Toàn bộ câu |
SNR: – 6 dB |
Bộ các câu mở trong tiếng ồn |
[22] |
Các từ |
SNR: – 3 dB |
Bộ các từ mở trong yên lặng |
[13] |
Các từ |
28 dB |
Bộ các từ mở trong yên lặng |
[30] |
Các từ |
23 dB |
Bộ các từ mở trong yên lặng |
[13] |
Các âm vị |
24 dB |
Bộ các câu đóng trong tiếng ồn |
[27] |
Các từ |
SNR: – 8 dB |
CHÚ THÍCH: Tất cả các phép thử nhận dạng giọng nói trong tiếng ồn trong các ví dụ này đã sử dụng tiếng ồn ngẫu nhiên phù hợp về phổ làm âm xen vào.
C.3 Độ tin cậy của phép thử-thử lại điển hình
Bảng C.2 biểu thị các độ tin cậy điển hình của phép thử-thử lại để đánh giá nhận dạng giọng nói mang lại sử dụng một số các chất giọng nêu tại Phụ lục A.
Bảng C.2 – Các độ tin cậy của phép thử-thử lại điển hình
Loại chất giọng thử, số lượng các dữ liệu thử |
Tài liệu tham khảo |
Cho điểm |
Các độ tin cậy của phép thử-thử lại điển hình đối với mức ngưỡng nhận dạng giọng nói và đánh giá nhận dạng giọng nói, đối với những người nghe có thính lực bình thường |
Bộ các câu mở trong yên lặng, 10 câu |
[20] |
Các từ |
2 dB |
Bộ các câu mở trong tiếng ồn, 10 câu |
[19] |
Các từ |
0,9 dB |
Bộ các câu mở trong tiếng ồn, 10 câu |
[21] |
Toàn bộ câu |
1,2 dB |
Bộ các từ mở trong yên lặng, 50 từ |
[13] |
Các từ |
10% |
Bộ các từ mở trong yên lặng, 50 từ |
[13] |
Âm vị |
8% |
Bộ các câu đóng trong tiếng ồn, 20 câu |
[27] |
Toàn bộ câu |
1 dB |
Phụ lục D
(tham khảo)
Tối ưu hóa sự cân bằng tri giác của các danh mục thử
Sự tương đương về cảm nhận của các danh mục thử có thể tối ưu hóa theo các cách khác nhau.
Một khả năng là phải điều chỉnh mức của các dữ liệu thử cụ thể đối với giá trị trung bình đo được của các đánh giá nhận dạng giọng nói các dữ liệu thử. Các dữ liệu có mức nhận dạng giọng nói thấp hơn so với mức trung bình là được khuếch đại và các dữ liệu có mức nhận dạng giọng nói cao hơn so với mức trung bình là được suy giảm. Chỉ áp dụng các điều chỉnh về mức đối với các mức ngưỡng nhận dạng giọng nói cụ thể có các chênh lệch vượt quá 0,5 dB so với mức ngưỡng trung bình nhận dạng giọng nói của một chất giọng. Các điều chỉnh về mức không gây ra các chênh lệch về âm lượng nhận thấy được giữa các dữ liệu thử cụ thể riêng biệt trong phạm vi các tác nhân kích thích thử (ví dụ, các chênh lệch về âm lượng giữa các từ cụ thể đặc biệt của một câu thử).
Một khả năng khác là để các mức của các dữ liệu thử khác nhau trong phạm vi một lần truyền giọng nói (ví dụ, câu) không đổi và đưa vào các hệ số trọng số đối với các dữ liệu thử cụ thể riêng biệt. Các dữ liệu có mức nhận dạng giọng nói thấp hơn so với mức trung bình có các trọng số cao hơn và các dữ liệu có mức nhận dạng giọng nói cao hơn so với mức trung bình có các trọng số thấp hơn. Tổng các hệ số trọng số trên một tác nhân kích thích thử (ví dụ, một câu) phải bằng 1.
Phụ lục E
(tham khảo)
Độ không đảm bảo đo
E.1 Quy định chung
Nói chung hình thức chấp nhận để biểu thị các độ không đảm bảo kèm theo các kết quả của các phép đo được quy định tại TCVN 9595-3 (ISO/IEC Guide 98-3). Hình thức trình bày này yêu cầu sự tương quan về hàm số (hàm mẫu) phải được thiết lập giữa các đại lượng đo, mà trong nội dung của tiêu chuẩn này là mức ngưỡng nhận dạng giọng nói của đối tượng thử, và một vài các đại lượng đầu vào mô tả các hiệu ứng có thể ảnh hưởng đến kết quả đo. Từng đại lượng trong số các đại lượng đầu vào được đặc trưng hóa theo ước lượng của nó, sự phân bố xác suất, và độ không đảm bảo chuẩn của nó. Sự hiểu biết hiện hành về các đại lượng đầu vào này phải được tổng hợp vào một bảng thành phần về độ không đảm bảo từ đó có thể rút ra độ không đảm bảo chuẩn tổng hợp và độ không đảm bảo mở rộng của các kết quả đo.
Các dữ liệu đã được đánh giá xác nhận về mặt khoa học cần thiết để thiết lập bảng thành phần về độ không đảm bảo về âm đối với từng phép đo được thực hiện, sử dụng bất kỳ quy trình nào của tiêu chuẩn này, mà tại thời điểm phát hành chưa có sẵn. Tuy nhiên, có thể đưa ra chỉ dẫn về các nguồn gốc liên quan đến độ không đảm bảo và các đặc tính của nó, phần lớn là dựa vào kiến thức mang tính kinh nghiệm. Cách tiếp cận chung để tính toán độ không đảm bảo đo phù hợp với TCVN 9595-3 (ISO/IEC Guide 98-3) được mô phỏng trong phụ lục này, cho phép xác định gần đúng các độ không đảm bảo dưới các giả thiết riêng, cụ thể.
E.2 Hàm mẫu
Cách trình bày phép xác định mức ngưỡng nhận dạng giọng nói, LHT. được tính theo Công thức (E.1):
LHT = L’HT + δeq + δtr + δm + δte + δsu + δpr + δtm + δn + δmth |
(E.1) |
Trong đó:
L’HT | là kết quả của phép xác định mức ngưỡng nhận dạng giọng nói phù hợp theo bất kỳ quy trình nào quy định trong tiêu chuẩn này (xem E.3.2); |
δeq | là đại lượng đầu vào cho phép bất kỳ sai lệch nào so với hiệu suất danh định của thiết bị đo thính lực sử dụng (E.3.3): |
δtr | là đại lượng đầu vào cho phép các độ không đảm bảo đo do việc sử dụng loại bộ chuyển đổi cụ thể và các đầu nối của nó (E.3.4): |
δm | là đại lượng đầu vào cho phép bất kỳ độ không đảm bảo do tiếng ồn che phủ không tối ưu hoặc âm xen vào (E.3.5); |
δte | là đại lượng đầu vào cho phép bất kỳ độ không đảm bảo do thiếu trình độ và kinh nghiệm của thử nghiệm viên (E.3.6); |
δsu | là đại lượng đầu vào cho phép bất kỳ độ không đảm bảo do thiếu hợp tác và các phản hồi không tin cậy của đối tượng thử (E.3.7); |
δpr | là đại lượng đầu vào cho phép bất kỳ độ không đảm bảo do phát sinh các vấn đề đặc biệt từ tình trạng khó khăn bất thường của phép đo (E.3.8). |
δtm | là đại lượng đầu vào cho phép chất lượng khác nhau của bản ghi chất giọng phù hợp theo Điều 4. (E.3.9); |
δn | là đại lượng đầu vào cho phép ảnh hưởng của các điều kiện môi trường không lý tưởng, đặc biệt là tiếng ồn xung quanh (E.3.10); |
δmth | là đại lượng đầu vào cho phép bất kỳ các độ không đảm bảo do phát sinh từ phương pháp thử đã sử dụng (E.3.11). |
Thông thường, mỗi đại lượng đầu vào δ được cho là có âm lượng bằng 0 dB, tức là không hiệu chính mức ngưỡng nghe đã xác định. Tuy nhiên, từng đại lượng trong số các đại lượng này là liên quan với độ không đảm bảo như giải thích tại E.3. Không một đại lượng đầu vào nào là tương quan với đại lượng khác với bất kỳ phạm vi nào.
CHÚ THÍCH: Cũng có thể, đối với các đại lượng đo khác, Công thức (E.1) yêu cầu có sự thay đổi thích hợp.
E.3 Các đại lượng đầu vào
E.3.1 Quy định chung
Các đại lượng đầu vào mô tả tại E.3.2 đến E.3.6 và E.3.9 đến E.3.11 phải được xem xét đến trong hầu như tất cả các ứng dụng về thính lực trong khi tất cả các điều mô tả tại E.3.7 đến E.3.8 chỉ được xét đến trong các trường hợp ngoại lệ khi đánh giá mang tính cá nhân về thử nghiệm viên.
E.3.2 Mức ngưỡng nghe xác định, L’HT
Trong quá trình đo thính lực hàng ngày, thường xuyên xác định mức ngưỡng nghe của đối tượng thử chỉ một lần cho một tai hoặc một lần cho hai tai. Tuy nhiên, dựa theo kinh nghiệm, có thể giả định các độ không đảm bảo chuẩn gần đúng đối với các phép đo lặp lại dưới cùng các điều kiện đào tạo và thử nghiệm giống nhau (xem 5.3 và C.3):
– đối với phép thử truyền qua không khí sử dụng một danh mục 10 câu: 1 dB;
– đối với phép thử truyền qua không khí sử dụng một bộ 10 từ thử đơn lẻ: 2,5 dB.
Phân bố xác suất của các giá trị có thể có của L’HT có thể cho là bình thường; ước lượng của nó được ký hiệu là L’HT (xem Bảng E.1).
E.3.3 Thiết bị đo thính lực, δeq
Giả sử là thiết bị đo thính lực phù hợp các yêu cầu của IEC 60645-2 đối với máy đo thính lực loại A hoặc loại B, phân bố nổi trội của nó đối với độ không đảm bảo chuẩn có thể là do sự độ lệch của các mức đầu ra lấy từ các giá trị danh định. IEC 60645-2 quy định các độ lệch lớn nhất như sau:
– truyền qua không khí: ± 3 dB.
Nếu không có sẵn các thông tin cụ thể về tính năng của thiết bị, thì sự phân bố xác suất của các kết quả (mức) đầu ra có thể giả sử là chữ nhật, dẫn đến các độ không đảm bảo chuẩn bằng một nửa độ rộng lớn nhất của các giá trị có thể xảy ra, chia cho Ö3.
Nếu cỡ bước điều chỉnh mức nghe là 5 dB, thì sẽ tạo ra sự phân bố độ không đảm bảo khác không bỏ qua được với sự phân bố xác suất chữ nhật và độ không đảm bảo chuẩn bằng 2,5Ö3 dB.
Hai phân phối này tạo thành độ không đảm bảo chuẩn toàn phần gần đúng, ví dụ, đối với truyền qua không khí, bằng:
E.3.4 Bộ chuyển đổi và đầu nối của nó, δtr
Các mức áp suất âm do các loại bộ chuyển đổi khác nhau truyền vào tai của đối tượng thử có thể có độ nhạy khác nhau do với các đặc tính giải phẫu và sinh lý của đối tượng thử, do vị trí của nó được đặt vào tai và do các độ lệch về độ căng của dây đeo so với các giá trị danh định. Nói chung các con số có hiệu lực đối với sự đóng góp vào độ không đảm bảo từ các hiệu ứng này hiện nay không thể công bố được. Tuy nhiên, nếu không có sẵn các thông tin cụ thể hơn, thì giả sử là độ không đảm bảo chuẩn bằng 2,5 dB. Hai hiệu ứng kết hợp dẫn đến độ không đảm bảo đo xấp xỉ bằng Ö(1,52 + 2,52)dB = 2,9 dB.
E.3.5 Tiếng ồn che phủ và tiếng ồn xen vào, δm
Các mức ngưỡng nhận dạng giọng nói có thể bị ảnh hưởng do sử dụng tiếng ồn che phủ không tối ưu. Không thể đưa ra các con số giá trị chung về sự đóng góp của hiệu ứng này đối với độ không đảm bảo đo. Tuy nhiên, độ không đảm bảo chuẩn bằng 2 dB có thể tạm thời quy cho δm với phân bố xác suất bình thường nếu áp dụng tiếng ồn che phủ. Ảnh hưởng của các thay đổi trong tiếng ồn xen vào, giả sử là cùng loại như tiếng ồn và các điều kiện thử khác, cũng bao gồm trong độ không đảm bảo chuẩn đối với các phép đo lặp lại.
E.3.6 Kinh nghiệm của thử nghiệm viên, δte
Đối với thí nghiệm trình độ có đủ kinh nghiệm, trong các trường hợp thử nghiệm bình thường, đóng góp vào độ không đảm bảo do các đánh giá mang tính cá nhân có thể đã bao gồm trong độ không đảm bảo chuẩn đối với các phép đo lặp lại (xem E.3.2). Trong các trường hợp đặc biệt, có thể phù hợp để quy cho độ không đảm bảo bổ sung đối với δte.
E.3.7 Phản hồi của đối tượng thử, δsu
Trong các trường hợp bình thường, các độ không đảm bảo do các mẫu thuẫn nhỏ trong các câu phản hồi của đối tượng thử bao gồm trong độ không đảm bảo chuẩn trong các phép đo lặp lại (xem E.3.2). Tuy nhiên, trong các trường hợp ngoại lệ cũng có thể có các nguyên nhân cho là độ không đảm bảo bổ sung đối với δsu.
E.3.8 Các trường đo đặc biệt, δpr
Có thể có các trường ngoại lệ, trong đó rất khó khăn để xác định mức ngưỡng nhận dạng giọng nói của đối tượng thử. Trong các trường hợp như vậy, độ không đảm bảo bổ sung có thể quy về δpr.
E.3.9 Chất lượng khác nhau của chất giọng thử, δtm
Các mức nhận dạng giọng nói có thể bị ảnh hưởng bởi chất lượng khác nhau của bản ghi âm chất giọng thử phù hợp theo Điều 4. Không thể đưa ra các con số giá trị chung về sự đóng góp của hiệu ứng này đối với độ không đảm bảo đo. Tuy nhiên, độ không đảm bảo chuẩn bằng 2 dB có thể tạm thời quy cho δtm với phân bố xác suất chuẩn. Sự ảnh hưởng của các thay đổi trong chất lượng của bản ghi âm chất giọng thử bao gồm trong độ không đảm bảo chuẩn đối với các phép đo lặp lại khi sử dụng các danh mục thử khác nhau của cùng một chất giọng.
E.3.10 Các điều kiện môi trường, δn
Nếu các yêu cầu về tiếng ồn của môi trường xung quanh hoàn toàn phù hợp (xem Điều 7), thì độ không đảm bảo chuẩn của δn có thể giả sử bằng 2 dB với phân bố xác suất chuẩn khi xác định ngưỡng phát hiện giọng nói, coi các đối tượng thử có mức ngưỡng nghe gần bằng 0 dB. Đối với phép xác định đánh giá điểm nhận dạng giọng nói và đối với các đối tượng thử có mức ngưỡng nghe cao hơn hẳn 0 dB, thì sự phân bố độ không đảm bảo do tiếng ồn môi trường xung quanh có thể bỏ qua.
E.3.11 Phương pháp thử đã sử dụng, δmth
Các mức ngưỡng nhận dạng giọng nói đo được chịu ảnh hưởng bởi phương pháp thử đã sử dụng như quy định tại 12.1 đến 12.5. Bên cạnh các nguồn gốc khác, các nguồn gốc về độ không đảm bảo của bản thân phương pháp sử dụng (giảm dần theo sự thích nghi), bước suy giảm đã sử dụng, và số lượng các dữ liệu thử đã dùng (hoàn thành các danh mục theo các bộ dữ liệu thử hoặc các danh mục thử đơn lẻ). Như đã nêu tại Điều 12, không có bằng chứng mang tính thực nghiệm các phương pháp khác đang tồn tại vào thời điểm công bố tiêu chuẩn này. Vì vậy, chỉ có một ước tính thô về độ không đảm bảo chuẩn dự kiến được đưa ra. Tuy nhiên, 2 dB có thể là một giá trị thực tế để sử dụng tạm thời.
E.4 Bảng thành phần độ không đảm bảo đo
Các đóng góp vào độ không đảm bảo tổng hợp cùng với giá trị của mức ngưỡng nghe xác định phụ thuộc vào các độ không đảm bảo chuẩn, ui, như mô tả tại E.3 và các hệ số độ nhạy liên quan, ci. Các hệ số độ nhạy là một số đo về sự ảnh hưởng đối với các giá trị của mức ngưỡng nghe do các thay đổi về giá trị của các đại lượng đầu vào tương ứng. Về mặt toán học chúng bằng đạo hàm từng phần của hàm mẫu đối với đại lượng đầu vào liên quan. Sự đóng góp của các đại lượng đầu vào tương ứng được tính bằng tích của các độ không đảm bảo đo và các hệ số độ nhạy của nó. Bảng thành phần độ không đảm bảo bao gồm các thông tin có sẵn đối với các đóng góp độ không đảm bảo khác nhau được trình bày theo dạng bảng.
Bảng E.1 – Biểu chung về bảng thành phần độ không đảm bảo đối với các phép xác định mức ngưỡng nghe được
Đại lượng |
Ước tính
|
Độ không đảm bảo chuẩn ui
|
Phân bố xác suất |
Hệ số độ nhạy ci |
Phân bố độ không đảm bảo ui ci |
|
dB |
dB |
|
|
dB |
L’HT |
L’HT.est |
u1 |
chuẩn |
1 |
u1 |
δeq |
0 |
u2 |
chữ nhật |
1 |
u2 |
δtr |
0 |
u3 |
chuẩn |
1 |
u3 |
δm |
0 |
u4 |
chuẩn |
1 |
u4 |
δte |
0 |
u5 |
chuẩn |
1 |
u5 |
δsu |
0 |
u6 |
chuẩn |
1 |
u6 |
δpr |
0 |
u7 |
chuẩn |
1 |
u7 |
δtm |
0 |
u8 |
chuẩn |
1 |
u8 |
δn |
0 |
u9 |
chuẩn |
1 |
u9 |
δmth |
0 |
u10 |
chuẩn |
1 |
u10 |
E.5 Độ không đảm bảo tổng hợp và độ không đảm bảo mở rộng
Độ không đảm bảo đo tổng hợp đối với mức ngưỡng nghe tính theo Phương trình (E.2):
(2) |
TCVN 9595-3 (ISO/IEC Guide 98-3) yêu cầu độ không đảm bảo mở rộng, U, được xác định sao cho khoảng thời gian [LHT – U, LHT + U] bao gồm, ví dụ, 95% của các giá trị của LHT mà có thể quy một cách hợp lý cho LHT– Đối với các mục đích này, sử dụng hệ số phủ, k, như vậy U = ku. Đối với xác suất phủ bằng 95% và phân bố chuẩn, k = 2.
E.6 Ví dụ
Độ không đảm bảo mở rộng được ước tính cho phép xác định mức ngưỡng nhận dạng giọng nói của một đối tượng thử sử dụng phép đo thính lực truyền qua không khí không có che phủ và giả sử các yêu cầu về tiếng ồn xung quanh là phù hợp và không phát sinh sự phân bố độ không đảm bảo tiếp theo từ các nguồn khác. Bảng thành phần độ không đảm bảo có hình thức trình bày như tại Bảng E.2.
Bảng E.2 – Ví dụ về bảng thành phần độ không đảm bảo đối với các điều kiện đo nêu trên
Đại lượng |
Ước tính |
Độ không đảm bảo chuẩn |
Phân bố xác suất |
Hệ số độ nhạy |
Phân bố độ không đảm bảo |
|
dB |
dB |
|
|
dB |
L’HT |
L’HT.est |
2,5 |
chuẩn |
1 |
2,5 |
δeq |
0 |
2,3 |
chữ nhật |
1 |
2,3 |
δtr |
0 |
2,9 |
chuẩn |
1 |
2,9 |
δmth |
0 |
2,0 |
chuẩn |
1 |
2,0 |
Độ không đảm bảo chuẩn tổng hợp: u =4,9 dB.
Độ không đảm bảo mở rộng đối với xác suất phủ 95%, được làm tròn đến số nguyên đêxiben gần nhất: U = 10 dB.
Thư mục tài liệu tham khảo
[1 ] TCVN 11111-1 (ISO 389-1), Âm học – Mức chuẩn zero để hiệu chuẩn thiết bị đo thính lực – Phần 1: Mức áp suất âm ngưỡng tương đương chuẩn đối với âm đơn tai và nghe ốp tai.
[2] TCVN 11111-4 (ISO 389-4), Âm học – Mức chuẩn zero để hiệu chuẩn thiết bị đo thính lực – Phần 4: Mức chuẩn đối với tiếng ồn che phủ dải hẹp.
[3] ISO/TR 25417, Acoustics – Definitions of basic quantities and terms.
[4] I EC 50801, International Electrotechnical Vocabulary – Chapter 801: Acoustics and electroacoustics
[5] IEC 60318-1, Electroacoustics – Simulators of human head and ear – Part 1: Ear simulator for the measurement of supra-aural and circumaural earphones
[6] IEC 60318-3, Electroacoustics – Simulators of human head and ear – Part 3: Acoustic coupler for the calibration of supra-aural earphones used in audiometry
[7] IEC 61260, Electroacoustics – Octave-band and fractional-octave-band filters
[8] ITU-T Recommendation G.227, International analogue carrier systems – General characteristics common to all analogue carrier-transmission systems – Conventional telephone signal. Available (viewed 2012-02-21) at: http://www.itu.int/T-REC-G.227-198811-l/en
[9] LUDVIGSEN, C. Comparison of certain measures of speech and noise level. Scand. Audiol. 1992, 21, pp. 23-29
[10] MARTIN, M., editor. Speech audiometry. London: Whurr, 1987
[11] WILSON, R.H., Morgan. D.E., DIRKS, D.D. A proposed SRT procedure and its statistical precedent. J. Speech Hear. Dis. 1973, 38, pp. 184-191
[12] ELBERLING, C., LUDVIGSEN, C., LYREGAARD, P.E. Dantale: a new Danish speech material. Scand. Audiol. 1989, 18, pp. 169-175
[13] KEIDSER, G. Normative data in quiet and in noise for “DANTALE” – a Danish speech material. Scand. AudioI. 1993, 22, pp. 231-236
[14] Olsen, S.Æ. Evaluation of the list of numerals in the Danish speech audiometry material. Scand. Audiol. 1996, 25, pp. 103-107
[15] SAKAMOTO, S., YOSHIKAWA, T., AMANO, S., SUZUKI, Y., KONDO, T. New 20-word lists for word intelligibility test in Japanese, In: Proc. of 9th International Conference on Spoken Language Processing (INTERSPEECH 2006 – ICSLP), 2006, pp. 2158-2161
[16] BRAND, T., ACHTZEHN, J., KOLLMEIER, B. Erstellung von Testlisten für den Oldenburger Kinder-Reimtest [Development of test lists for the Oldenburger children’s rhyme test], Z. AudioI. 1999, (Suppl. II), pp. 50-51
[17] BRAND, T., WAGENER, K.C. Wie lässt sich die maximale Verständlichkeit optimal bestimmen? [How can maximum speech recognition be determined optimally?] In: 8. Jahrestagung der Deutschen Gesellschaft fur Audiologie, Tagungs CD, ISBN 3-9809869-4-2. 2005
[18] Von WALLENBERG, E.L., KOLLMEIER, B. Sprachverständlichkeitsmessungen für die Audiologie mit einem Reimtest in deutscher Sprache: Erstellung und Evaluation von Testlisten [Measurements of speech recognition in audiology with a rhyme test in the German language: Development and evaluation of test lists]. Audiol. Akust. 1989, 28, pp. 50-65
[19] HÄLLGREN, M., LARSBY, B., ARLINGER, S. A Swedish version of the Hearing in Noise Test (HINT) for measurement of speech recognition. Int. J. AudioI. 2006, 45, pp. 227-237
[20] KOLLMEIER, B., WESSELKAMP, M. Development and evaluation of a German sentence test for objective and subjective speech intelligibility assessment. J. Acoust. Soc. Am. 1997, 102, pp. 2412-2421
[21] KALIKOW, D.N., STEVENS, K.N., ELLIOT, L.L. Development of a test of speech intelligibility in noise using sentences with controlled word predictability. J. Acoust. Soc. Am. 1977, 61, pp. 1337-1351
[22] NILSSON, M., SOLI, S.D., SULLIVAN, J.A. Development of Hearing In Noise Test for measurement of speech reception thresholds in quiet and in noise. J. Acoust. Soc. Am. 1994, 95, pp. 1085- 1099
[23] PLOMP, R., MIMPEN, A.M. Improving the reliability of testing the speech reception threshold for sentences. Audiology 1979, 18, pp. 43-52
[24] KILLION, M.C., NIQUETTE, P.A., GUDMUNDSEN, G.I., REVIT, L.J., BANERJEE, S. Development of a quick speech-in-noise test for measuring signal-to-noise ratio loss in normal-hearing and hearing-impaired listeners. J. Acoust. Soc.Am. 2004, 116, pp. 2395-2405
[25] HAGERMAN, B. Sentences for testing speech intelligibility in noise. Scand. Audiol. 1982, 11, pp. 79-87
[26] WAGENER, K., BRAND, T., KÜHNEL, V., KOLLMEIER, B. Entwicklung und Evaluation eines Satztests für die deutsche Sprache l-lll: Design, Optimierung und Evaluation des Oldenburger Satztests [Development and evaluation of a sentence test for the German language l-lll: Design, optimization and evaluation of the Oldenburger sentence test], Z. Audiol. 1999, 38, pp. 4-15, 44- 56, 86-95
[27] WAGENER, K., JOSVASSEN, J.L., ARDENKJAER, R. Design, optimization and evaluation of a Danish sentence test in noise. Int. J. Audiol. 2003, 42, pp. 10-17
[28] Wagener, K.C., KOLLMEIER, B. Evaluation des Oldenburger Satztests mit Kindern und Oldenburger Kinder-Satztest [Evaluation of the Oldenburger sentence test with children and the Oldenburger sentence test for children], Z. Audiol. 2005, 44, pp. 134-143
[29] WAGENER, K.C., BRAND, T., KOLLMEIER, B. Evaluation des Oldenburg Kinder-Reimtests in Ruhe und im Stӧrgeräusch [Evaluation of the Oldenburger rhyme test for children in silence and in noise], HNO 2006, 54, pp. 171-178
[30] Han, H., LEE, J., Cho, S., KIM, J., LEE, K., CHOI, W. Reference sound pressure level for Korean speech audiometry. Int. J. Audiol. 2011, 50, pp. 59-62
[31] DRESCHLER, W.A., VERSCHUURE, H., LUDVIGSEN, C., WESTERMANN, S. ICRA noises: artificial noise signals with speech-like spectral and temporal properties for hearing instrument assessment. International Collegium of Rehabilitative Audiology. Audiology 2001, 40, pp. 148- 157
[32] WAGENER, K.C., BRAND, T. Sentence intelligibility in noise for listeners with normal hearing and hearing impairment: Influence of measurement procedure and masking parameters. Int. J. Audiol. 2005, 44, pp. 144-157
[33] FASTL, H. A background noise for speech audiometry. Audiol. Acoust. 1987, 26, pp. 2-13
MỤC LỤC
Lời nói đầu
Lời giới thiệu
1 Phạm vi áp dụng
2 Tài liệu viện dẫn
3 Thuật ngữ và định nghĩa
4 Các yêu cầu về ghi chất giọng
4.1 Các yêu cầu chung
4.2 Việc ghi âm chuẩn
4.3 Môi trường ghi âm
4.4 Đáp ứng tần số của thiết bị ghi âm
4.5 Khoảng thời gian giữa các dữ liệu thử liên tiếp
4.6 Các mức
4.7 Tỷ số tín hiệu và tiếng ồn
4.8 Cân bằng âm vị trên các dạng mục thử
4.9 Cân bằng cảm nhận trên các dạng mục thử
5 Đánh giá xác nhận các bản ghi âm chất giọng
5.1 Quy định chung
5.2 Xác định đường cong nhận dạng giọng nói
5.3 Xác định tương đương về tri giác của các danh mục thử
5.4 Xác định độ lặp lại của các kết quả (độ tin cậy trung bình của phép thử-thử lại)
5.5 Lập hồ sơ
6 Các yêu cầu đối với phép đo thính lực giọng nói
7 Các mức áp suất âm xung quanh trong phòng thử đối với phép đo thính lực giọng nói
8 Phép đo thính lực giọng nói tại trường âm
9 Chuẩn bị và hướng dẫn đối tượng thử
9.1 Quy định chung
9.2 Chuẩn bị đối tượng thử
9.3 Hướng dẫn các đối tượng thử
10 Cách phản hồi của đối tượng thử
11 Xác định mức ngưỡng phát hiện giọng nói
12 Xác định mức ngưỡng nhận dạng giọng nói
12.1 Quy định chung
12.2 Quy trình giảm sử dụng các bước 5 dB
12.3 Quy trình giảm khác
12.4 Quy trình thích nghi sử dụng các cỡ bước cố định
12.5 Quy trình thích nghi khác
13 Xác định các cho điểm nhận dạng giọng nói
14 Che phủ tai đối bên
15 Phép đo thính lực giọng nói với âm xen vào
15.1 Loại âm xen vào
15.2 Truyền âm xen vào
15.3 Các mức giọng nói và âm xen vào
15.4 Quy trình thử
16 Hình thức trình bày của biểu đồ thính lực giọng nói
17 Độ không đảm bảo đo
18 Bảo dưỡng và hiệu chuẩn thiết bị
18.1 Quy định chung
18.2 Các khoảng thời gian giữa các phép thử
18.3 Giai đoạn A: Kiểm tra hàng ngày và các phép thử nghe
18.4 Giai đoạn B: Các phép thử điện thanh định kỳ
18.5 Giai đoạn C: Các phép thử hiệu chuẩn cơ bản
Phụ lục A (tham khảo) Ví dụ về các chất giọng
Phụ lục B (tham khảo) Các ví dụ về các điều kiện của âm xen vào
Phụ lục C (tham khảo) Các kết quả điển hình
Phụ lục D (tham khảo) Tối ưu hóa sự cân bằng tri giác của các danh mục thử
Phụ lục E (tham khảo) Độ không đảm bảo đo
Thư mục tài liệu tham khảo
TIÊU CHUẨN QUỐC GIA TCVN 11737-3:2016 (ISO 8253-3:2012) VỀ ÂM HỌC – PHƯƠNG PHÁP ĐO THÍNH LỰC – PHẦN 3: PHÉP ĐO THÍNH LỰC BẰNG GIỌNG NÓI | |||
Số, ký hiệu văn bản | TCVN11737-3:2016 | Ngày hiệu lực | 30/12/2016 |
Loại văn bản | Tiêu chuẩn Việt Nam | Ngày đăng công báo | |
Lĩnh vực |
Lĩnh vực khác |
Ngày ban hành | 30/12/2016 |
Cơ quan ban hành |
Bộ khoa học và công nghê |
Tình trạng | Còn hiệu lực |
Các văn bản liên kết
Văn bản được hướng dẫn | Văn bản hướng dẫn | ||
Văn bản được hợp nhất | Văn bản hợp nhất | ||
Văn bản bị sửa đổi, bổ sung | Văn bản sửa đổi, bổ sung | ||
Văn bản bị đính chính | Văn bản đính chính | ||
Văn bản bị thay thế | Văn bản thay thế | ||
Văn bản được dẫn chiếu | Văn bản căn cứ |