TIÊU CHUẨN QUỐC GIA TCVN 4831: 2009 (ISO 5495 : 2005) VỀ PHÂN TÍCH CẢM QUAN – PHƯƠNG PHÁP LUẬN – PHÉP THỬ SO SÁNH CẬP ĐÔI
TCVN 4831 : 2009
ISO 5495 : 2005
PHÂN TÍCH CẢM QUAN – PHƯƠNG PHÁP LUẬN – PHÉP THỬ SO SÁNH CẶP ĐÔI
Sensory analysis – Methodology – Paired comparison test
Lời nói đầu
TCVN 4831 : 2009 thay thế TCVN 4831 : 1989;
TCVN 4831 : 2009 hoàn toàn tương đương với ISO 5495 : 2005, Đính chính kỹ thuật 1 : 2006;
TCVN 4831 : 2009 do Ban kỹ thuật tiêu chuẩn quốc gia TCVN/TC/F13 Phương pháp phân tích và lấy mẫu biên soạn, Tổng cục Tiêu chuẩn Đo lường Chất lượng đề nghị, Bộ Khoa học và Công nghệ công bố.
PHÂN TÍCH CẢM QUAN – PHƯƠNG PHÁP LUẬN – PHÉP THỬ SO SÁNH CẶP ĐÔI
Sensory analysis – Methodology – Paired comparison test
1. Phạm vi áp dụng
Tiêu chuẩn này mô tả qui trình xác định xem có hoặc không có sự khác nhau hoặc giống nhau giữa hai mẫu về cường độ các thuộc tính cảm quan. Phép thử này đôi khi được coi như phép thử sự khác nhau có định hướng hoặc phép thử 2-AFC (Buộc phải lựa chọn thay thế). Trong thực tế, phép thử so sánh cặp đôi là phép thử lựa chọn bắt buộc giữa hai sự lựa chọn.
CHÚ THÍCH Phép thử so sánh cặp đôi là phép thử phân loại hiện hành đơn giản nhất vì chỉ liên quan đến hai mẫu.
Phương pháp này có thể áp dụng khi có sự khác nhau trong một hoặc một vài thuộc tính cảm quan riêng lẻ, có nghĩa là phương pháp này có thể xác định có hay không có sự khác nhau có thể nhận biết được liên quan đến thuộc tính đã cho và yêu cầu về hướng của sự khác nhau, nhưng phương pháp này không đưa ra bất kỳ một chỉ dẫn nào về chừng mực khác nhau này. Khi không có sự khác nhau về thuộc tính đang nghiên cứu không có nghĩa là không có sự khác nhau nào giữa hai sản phẩm.
Phương pháp này chỉ có thể áp dụng nếu các sản phẩm tương đối đồng nhất.
Phương pháp này có hiệu lực khi:
a) để xác định
– khi có sự khác nhau có thể chấp nhận được (phép thử cặp đôi về sự khác biệt) hoặc;
– khi không có sự khác nhau có thể chấp nhận được (phép thử cặp đôi về sự giống nhau), ví dụ: có những sửa đổi về thành phần, qui trình chế biến, bao gói, vận chuyển hoặc bảo quản hoặc
b) để lựa chọn, đào tạo và giám sát người đánh giá
Trước khi bắt đầu phép thử, cần phải biết rằng đây là phép thử một phía (người giám sát phép thử biết trước hướng của sự khác nhau và giả thuyết thay thế ứng với sự tồn tại của sự khác nhau trong hướng mong đợi) hay là phép thử hai phía (người giám sát phép thử không biết trước hướng của sự khác nhau và giả thuyết thay thế ứng với sự tồn tại của sự khác nhau trong hướng nảy hoặc hướng khác).
Phép thử cặp đôi có thể được sử dụng để so sánh hai sản phẩm về sự ưa thích. Các trường hợp khác nhau về cách sử dụng phép thử cặp đôi được nêu trong Hình 1.
CHÚ THÍCH Chỉ có phép thử không cảm quan là được đề cập trong tiêu chuẩn này.
Hình 1 – Các trường hợp khác nhau sử dụng phép thử so sánh cặp đôi
VÍ DỤ 1: (Trường hợp a) Việc sản xuất bánh bích qui đã được điều chỉnh để bánh được giòn hơn. Cần kiểm tra xem việc tăng độ giòn như thế có thể nhận biết được không. Do đó, cần phải kiểm tra sự khác nhau nổi bật để biết sản phẩm mới được cảm nhận là giòn hơn so với sản phẩm thông thường (sản phẩm đối chứng).
VÍ DỤ 2: (Trường hợp b) Nhà sản xuất biết rằng sản phẩm có thể chứa một lượng nhỏ của thành phần làm mất mùi sản phẩm. Do đó nhà sản xuất muốn xác định lượng tối đa có thể chấp nhận được sao cho sự khác nhau về mùi so với sản phẩm đối chứng không chứa thành phần này đủ để cảm nhận được và do đó không có sự đáng tiếc nào xảy ra tiếp theo.
VÍ DỤ 3: (Trường hợp c) Mong muốn để sản xuất món xúp mới và để so sánh hai thành phần cho vị mặn. Vì các lý do giá thành, thì thành phần có cùng nồng độ mà sẽ cho vị mặn nhất là rất cần thiết. Do đó cần cố gắng làm rõ sự khác nhau. Chưa biết trước được thành phần nào sẽ tạo được vị mặn mạnh nhất.
VÍ DỤ 4: (Trường hợp d) Nhà sản xuất chất dẻo, cụ thể là sản xuất chắn bùn ôtô, để tiết kiệm, họ thay chất làm trơn thông thường bằng loại mới, nhưng không muốn công thức của chất dẻo mới có thể cảm nhận được bề mặt trơn hơn hoặc kém hơn so với loại thông thường, vấn đề xác định ở đây là với cùng nồng độ, thì chất làm trơn mới cho cùng mức độ “trơn bề mặt” như sản phẩm thông thường, cần chỉ ra rằng cả hai chất làm trơn là giống nhau về “trơn bề mặt”, nhưng chưa biết trước chất làm trơn nào có thể cho bề mặt trơn nhất.
2. Tài liệu viện dẫn
Các tài liệu viện dẫn sau rất cần thiết cho việc áp dụng tiêu chuẩn này. Đối với các tài liệu viện dẫn ghi năm công bố thì áp dụng phiên bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất, bao gồm cả các sửa đổi, bổ sung (nếu có).
ISO 5492 : 1992, Sensory analysis – Vocabulary (Phân tích cảm quan – Từ vựng).
ISO 6658 : 1985, Sensory analysis – Methodology – General guidance (Phân tích cảm quan – Phương pháp luận – Hướng dẫn chung).
ISO 8586-1 : 1993, Sensory analysis – General guidance for the selection, training and monitoring of assessors – Part 1: Selected assessors (Phân tích cảm quan – Hướng dẫn chung đối với việc lựa chọn, đào tạo và kiểm soát người đánh giá – Phần 1: Người đánh giá được lựa chọn).
ISO 8586-2 : 1994, Sensory analysis – General guidance for the selection, training and monitoring of assessors – Part 2: Experts (Phân tích cảm quan – Hướng dẫn chung đối với việc lựa chọn, đào tạo và kiểm soát người đánh giá – Phần 2: Chuyên gia).
ISO 8589 : 1988, Sensory analysis – General guidance for the design of test rooms (Phân tích cảm quan – Hướng dẫn chung đối với việc thiết kế phòng thử nghiệm).
3. Thuật ngữ và định nghĩa
Trong tiêu chuẩn này sử dụng các thuật ngữ, định nghĩa trong ISO 5492 và các thuật ngữ, định nghĩa sau đây:
3.1
Rủi ro a (alpha) [a (alpha) risk]
Xác suất kết luận rằng có sự khác nhau có thể chấp nhận được khi không có một sự khác nhau nào.
CHÚ THÍCH Điều này còn được gọi là sai lỗi loại I, mức có nghĩa hoặc mức dương tính giả.
3.2
Rủi ro b (beta) [b (beta) risk]
Xác suất kết luận rằng không có sự khác nhau có thể chấp nhận được khi có một sự khác nhau.
CHÚ THÍCH Điều này còn được gọi là sai lỗi loại II, mức độ âm tính giả.
3.3
Sự khác nhau (difference)
Tình huống mà trong đó các mẫu có thể phân biệt được dựa vào các thuộc tính cảm quan của chúng.
CHÚ THÍCH Tỷ lệ người đánh giá đã phát hiện sự khác nhau có thể cảm nhận được giữa các sản phẩm về thuộc tính cảm quan cần xem xét được đưa ra bằng ký hiệu pd.
3.4
Phép thử một phía [one-sided test]
Phép thử trong đó người giám sát phép thử có kiến thức trước liên quan đến hướng của sự khác nhau.
CHÚ THÍCH Giả thuyết “không” là Ho, là các sản phẩm không có sự khác nhau; tỷ lệ câu trả lời đúng, p, bằng 1/2. Giả thuyết thay thế H1,p > 1/2.
3.5
Phép thử hai phía [two-sided test]
Phép thử trong đó người giám sát phép thử không có kiến thức trước liên quan đến hướng của sự khác nhau.
CHÚ THÍCH Giả thuyết “không” là H0, là các sản phẩm không có sự khác nhau; tỷ lệ câu trả lời về một trong các mẫu, p, bằng 1/2. Giả thuyết thay thế H1,p ¹ 1/2.
3.6
Trả lời đúng (correct responses)
Trả lời như mong đợi (expected responses)
Trong trường hợp phép thử một phía, số người đánh giá tham gia phép thử đã chọn đúng mẫu, được người giám sát kỳ vọng có thuộc tính cảm quan mạnh nhất.
3.7
Trả lời đồng thuận (consensual responses)
Trong trường hợp phép thử hai phía, số người đánh giá chọn mẫu A lớn hơn số người đánh giá chọn mẫu B.
CHÚ THÍCH Số người này được tính như trên vì không có bất kỳ câu trả lời nào đúng.
3.8
Sản phẩm (product)
Vật liệu cần được đánh giá
3.9
Mẫu (sample)
Đơn vị sản phẩm đã chuẩn bị, được đưa ra và được đánh giá trong quá trình đánh giá.
3.10
Độ nhạy (sensitivity)
Thuật ngữ chung được áp dụng để tổng hợp các tính năng của phép thử.
CHÚ THÍCH Trong thuật ngữ thống kê, thì độ nhạy của phép thử được xác định theo các giá trị a, b và pd
3.11
Tính tương đồng (similarity)
Tình huống, trong đó sự khác nhau có thể cảm nhận được giữa các mẫu là quá nhỏ đến mức mà các mẫu đó có thể sử dụng để thay thế nhau.
4. Nguyên lý
Số lượng người đánh giá được chọn theo độ nhạy mong muốn của phép thử (Xem 6.2 và Chú thích kèm theo Bảng A.4 và Bảng A.5).
Những người đánh giá nhận được một bộ hai mẫu (một cặp). Họ sẽ chỉ định mẫu nào được coi là mạnh nhất về thuộc tính cảm quan, ngay cả khi việc lựa chọn này chỉ dựa vào dự đoán.
CHÚ THÍCH Một trong các mẫu này có thể là một mẫu đối chứng.
Số lần mà một mẫu được chọn tính được và sự khác nhau có nghĩa được xác định bằng cách so sánh với bảng thống kê có tính đến các kết quả thu được đối với mẫu dự đoán (phép thử một phía) hoặc số câu trả lời nhiều nhất thu được đối với các mẫu thử (phép thử hai phía).
5. Các điều kiện chung của phép thử
5.1 Xác định rõ ràng mục tiêu của phép thử để xác định nếu phép thử là một phía hoặc thử hai phía, nếu đó là phép thử về sự giống nhau hoặc khác nhau và phép thử nào có độ nhạy thích hợp nhất.
5.2 Tiến hành phép thử dưới các điều kiện ngăn ngừa được mọi sự trao đổi thông tin giữa những người đánh giá cho đến khi kết thúc việc đánh giá, sử dụng phòng và các trang thiết bị phù hợp với ISO 8589.
5.3 Chuẩn bị các mẫu ngoài tầm mắt của những người đánh giá và theo cách giống hệt nhau cho từng người; nghĩa là cùng loại dụng cụ, cùng loại chén.
5.4 Những người đánh giá không thể đưa ra bất kỳ kết luận nào về cường độ của thuộc tính theo cách mà các mẫu thể hiện. Ví dụ: đối với phép thử xúc giác, thì mọi sự khác nhau về bề ngoài phải tránh. Che dấu tất cả các màu khác nhau nếu mục tiêu của phép thử không liên quan đến màu sắc bằng cách sử dụng bộ lọc ánh sáng và/hoặc ánh sáng dịu. Các mẫu có thể được thể hiện liên tiếp hoặc không đồng thời trong trường hợp hơi có sự khác nhau về bề ngoài.
5.5 Mã số của các mẫu hoặc các chén đựng mẫu phải theo cách thống nhất, tốt nhất là sử dụng các số có 3 chữ số được chọn ngẫu nhiên cho mỗi phép thử. Mỗi cặp gồm hai mẫu, có mã số khác nhau. Tốt nhất là nên sử dụng các mã số khác nhau cho mỗi người đánh giá trong suốt phiên đánh giá. Tuy nhiên có thể sử dụng hai mã giống nhau cho tất cả những người đánh giá trong một phép thử, với điều kiện là mỗi mã số chỉ được sử dụng một lần cho một người đánh giá trong quá trình thử đánh giá (ví dụ: nếu trong cùng một phiên đánh giá tiến hành vài cặp thử trên các sản phẩm khác nhau).
5.6 Số lượng hoặc thể tích được cung cấp phải giống nhau đối với hai mẫu thử tạo thành một cặp, giống như tất cả các mẫu khác đối với sản phẩm đã nêu. số lượng hoặc thể tích cần được đánh giá có thể được ấn định. Nếu không, điều này cần qui định cho người đánh giá để lấy các lượng hoặc các thể tích mẫu tương tự.
5.7 Nhiệt độ của các cặp mẫu phải bằng nhiệt độ của tất cả các mẫu khác trong dãy phép thử trên sản phẩm đã nêu. Tốt nhất là để các mẫu ở nhiệt độ mà sản phẩm thường được tiêu dùng.
5.8 Những người đánh giá phải được thông báo trước rằng họ có phải tuân thủ thủ tục đặc biệt để đánh giá các sản phẩm hay không (ví dụ: có được nuốt mẫu để thử vị hoặc thực hiện động tác thể hiện về thử xúc giác hay không) hay là họ tự do làm như họ muốn. Khi được tự do làm những gì mình thích thì họ cần phải thực hiện theo cùng phương thức đối với tất cả các mẫu.
5.9 Trong suốt quá trình đánh giá, tránh đưa thông tin về nhận biết sản phẩm, hiệu quả xử lý mong đợi hoặc sự thực hiện riêng cho đến khi kết thúc các phép thử.
6. Người đánh giá
6.1 Trình độ chuyên môn
Tất cả những người đánh giá cần có trình độ chuyên môn mức ngang nhau, mức này được chọn trên cơ sở mục tiêu của phép thử (xem ISO 8586-1 và ISO 8586-2). Kinh nghiệm và sự hiểu biết sản phẩm có thể làm tăng khả năng của người đánh giá và do vậy có thể làm tăng khả năng tìm ra sự khác nhau có nghĩa. Việc giám sát khả năng của những người đánh giá qua thời gian cho thấy độ nhạy tăng.
Tất cả những người đánh giá phải hiểu biết về cơ chế của phép thử cặp đôi (phiếu ghi điểm, nhiệm vụ và qui trình đánh giá). Ngoài ra, những người đánh giá phải có thể nhận biết về thuộc tính cảm quan là cơ sở của phép thử. Thuộc tính này phải được xác định bằng chất chuẩn hoặc bằng cách thể hiện vài mẫu có các mức cường độ thuộc tính khác nhau cần thử nghiệm.
6.2 Số lượng người đánh giá
Chọn số lượng người đánh giá sao cho thu được độ nhạy theo yêu cầu đối với phép thử (xem Bảng A.4 về phép thử một phía và Bảng A.5 về phép thử hai phía). Sử dụng số lượng lớn người đánh giá làm tăng khả năng phát hiện đúng các sai khác nhỏ giữa các sản phẩm. Tuy nhiên trong thực tế, số lượng người đánh giá thường được xác định bởi các điều kiện thiết yếu (ví dụ: thời gian thực nghiệm, số lượng người đánh giá sẵn có, lượng sản phẩm). Khi tiến hành phép thử sự khác nhau, thì số lượng người đánh giá điển hình thường từ 24 người đến 30 người. Khi thực hiện phép thử sự giống nhau thì số lượng người đánh giá thường gấp đôi (khoảng 60 người). Khi thử nghiệm về tính giống nhau, các phép đánh giá không nên lặp lại bởi cùng người đánh giá. Tuy nhiên, nếu yêu cầu các phép đánh giá lặp lại để có đủ số lượng đánh giá tổng số, thì cần cố gắng để mỗi người đánh giá thực hiện cùng một số lượng đánh giá lặp lại. Ví dụ: nếu chỉ có sẵn 10 người đánh giá, thì mỗi người đánh giá sẽ tiến hành ba phép thử cặp đôi để thu được tổng số 30 lần đánh giá.
CHÚ THÍCH Phân tích ba lần đánh giá do 10 người đánh giá thực hiện theo 30 lần đánh giá độc lập là không có hiệu lực khi thử nghiệm về tính tương đồng sử dụng Bảng A.3. tuy nhiên, phép thử sự khác nhau sử dụng Bảng A.1 và A.2 là có hiệu lực ngay cả khi thực hiện các đánh giá lặp lại [5], [6]. Một số ấn bản gần đây [1]. [2] về các phép thử về sự khác biệt kép gợi ý các cách tiếp cận thay thế về phân tích các đánh giá lặp lại.
7. Cách tiến hành
7.1 Chuẩn bị giấy và bảng chấm điểm (Xem Hình B.1, B.2 và B.3) trước khi bắt đầu phép thử để sử dụng số lượng như nhau của hai chuỗi trình bày liên tục của cả hai sản phẩm A và B.
7.2 Trình bày hai mẫu của cặp so sánh liên tục hoặc đồng thời (xem 5.4). Trong trường hợp trình bày liên tục, thì bố trí hai mẫu theo cách giống nhau đối với mỗi người đánh giá (theo hàng từ trái sang phải, từ dưới lên trên v.v…). Những người đánh giá sẽ kiểm tra hai mẫu tạo thành cặp đôi theo thứ tự trong bảng chấm điểm, nhưng những người đánh giá thường được phép đưa ra các đánh giá lặp lại của mỗi mẫu nếu muốn (dĩ nhiên là nếu bản chất của sản phẩm cho phép đánh giá lặp lại).
7.3 Cần cung cấp một bảng chấm điểm cho mỗi cặp mẫu. Nếu người đánh giá thực hiện nhiều hơn một phép thử trong quá trình đánh giá thì thu lấy bảng chấm điểm đã hoàn thiện và các mẫu chưa sử dụng trước khi thực hiện cặp mẫu tiếp theo. Đánh giá viên không được quay lại với bất kỳ mẫu thử nào trước đó, cũng như không thay đổi quyết định nào liên quan đến phép thử trước đó.
7.4 Không được có bất kỳ câu hỏi nào về ưu điểm, sự chấp nhận hoặc độ khác nhau theo sự lựa chọn của mẫu có cường độ mạnh nhất. Việc lựa chọn mà người đánh giá vừa làm xong có thể sai lệch so với câu trả lời cho mọi câu hỏi bổ sung. Các câu trả lời cho những câu hỏi đó có thể thu được qua các phép thử riêng rẽ liên quan đến ưu điểm, sự chấp nhận hoặc độ khác nhau… (xem ISO 6658). Phần “Nhận xét” đề nghị đưa ra các lý do lựa chọn mà có thể bao gồm trong các lưu ý của người đánh giá.
7.5 Phép thử so sánh cặp đôi là qui trình “lựa chọn bắt buộc”; những người đánh giá không được phép chọn “không có sự khác nhau”. Khi người đánh giá phát hiện không có sự khác nhau giữa các mẫu cần được hướng dẫn chọn một trong các mẫu và chỉ ra rằng việc lựa chọn chỉ là phỏng đoán trong phần “Nhận xét” của bảng chấm điểm.
8. Phân tích và diễn giải kết quả
8.1 Khi thử về sự khác nhau
8.1.1 Trường hợp thử một phía
Sử dụng Bảng A.1 để phân tích các số liệu thu được trong phép thử cặp đôi. Nếu số câu trả lời đúng bằng hoặc lớn hơn số lượng nêu trong Bảng A.1 (tương ứng với số lượng người đánh giá và với mức rủi ro a đã chọn cho phép thử), thì kết luận rằng có sự khác nhau có thể nhận biết được giữa các mẫu (xem B.1).
Nếu muốn, tính khoảng tin cậy trên tỷ lệ những người có thể phân biệt được các mẫu. Phương pháp này được qui định trong B.5.
8.1.2 Trường hợp thử hai phía
Sử dụng Bảng A.2 để phân tích các số liệu thu được trong phép thử cặp đôi. Nếu số câu trả lời đồng thuận bằng hoặc lớn hơn số lượng nêu trong Bảng A.2 (tương ứng với số lượng người đánh giá và với mức rủi ro a đã chọn cho phép thử), thì kết luận rằng có sự khác nhau có thể nhận biết được giữa các mẫu (xem B.3).
Nếu muốn, tính khoảng tin cậy trên tỷ lệ những người có thể phân biệt được các mẫu. Phương pháp này được qui định trong B.5.
8.2 Khi thử về sự tương đồng [1])
8.2.1 Trường hợp thử một phía
Sử dụng Bảng A.3 để phân tích các số liệu thu được trong phép thử cặp đôi. Nếu số câu trả lời đúng nhỏ hơn hoặc bằng số lượng nêu trong Bảng A.3 (tương ứng với số lượng người đánh giá, với mức rủi ro b và giá trị pd đã chọn cho phép thử), thì kết luận rằng có sự khác nhau không đáng kể giữa các mẫu (xem B.2). Nếu các kết quả của phép thử này được so sánh với kết quả của một phép thử khác thì cần chọn cùng một giá trị pd cho tất cả các phép thử.
Nếu muốn, tính khoảng tin cậy trên tỷ lệ những người có thể phân biệt được các mẫu. Phương pháp này được qui định trong B.5.
Không có kết luận nào đưa ra với các số tối đa các câu trả lời đúng dưới n/2.
8.2.2 Trường hợp thử hai phía
Sử dụng Bảng A.3 để phân tích các số liệu thu được trong phép thử cặp đôi. Nếu số câu trả lời đúng nhỏ hơn hoặc bằng số lượng nêu trong Bảng A.3 (tương ứng với số lượng người đánh giá, với mức rủi ro b và với giá trị pd đã chọn cho phép thử), thì kết luận rằng có sự khác nhau không đáng kể giữa các mẫu (xem B.4). Nếu các kết quả của phép thử này được so sánh với kết quả của một phép thử khác thì cần chọn cùng một giá trị pd cho tất cả các phép thử.
Nếu muốn, tính khoảng tin cậy trên tỷ lệ những người có thể phân biệt được các mẫu. Phương pháp này được qui định trong B.5.
9. Báo cáo thử nghiệm
Báo cáo mục đích thử nghiệm, các kết quả thu được và các kết luận. Khuyến cáo bổ sung các thông tin sau đây:
– mục đích của phép thử và bản chất của việc xử lý cần nghiên cứu;
– nhận biết đầy đủ về mẫu thử: nguồn gốc, phương pháp chuẩn bị, lượng, hình dạng, bảo quản trước khi thử, lượng mẫu cung cấp, nhiệt độ (thông tin liên quan đến mẫu cần chỉ rõ đầy đủ về bảo quản, vận chuyển và các thao tác chuẩn bị cần phải thực hiện sao cho tạo được các mẫu mà khác nhau chỉ do có sự thay đổi về điều quan tâm, nếu có);
– số lượng đánh giá viên, số câu trả lời đúng hoặc đồng thuận và kết quả đánh giá thống kê (bao gồm các giá trị a, b và pd và dùng trong phép thử;
– những người đánh giá: kinh nghiệm (trong thử đánh giá cảm quan với sản phẩm, với mẫu thử) tuổi và giới tính (xem ISO 8586-1 và ISO 8586-2);
– mọi thông tin cụ thể và các khuyến cáo đưa ra cho người đánh giá liên quan đến phép thử, cụ thể là khi xác định chính xác và các mẫu chuẩn minh họa thuộc tính cần thử và/hoặc thủ tục thử nghiệm đã được chỉ cho người đánh giá;
– môi trường thử nghiệm: thiết bị sử dụng, thực hiện đồng thời hay kế tiếp, việc nhận biết các mẫu đã được phơi ra sau khi thử nghiệm và nếu có thì theo cách nào;
– nơi, ngày thử nghiệm và tên của chủ tịch hội đồng.
10. Độ chụm và độ chệch
Vì các kết quả của các phép thử phân biệt về cảm quan phụ thuộc vào độ cảm nhận của từng cá thể, nên không thể đưa ra tuyên bố chung liên quan đến độ tái lập của các kết quả để có thể áp dụng cho tất cả những người đánh giá. Độ chụm liên quan đến số lượng cụ thể của người đánh giá tăng theo cỡ nhóm, cũng như với sự đào tạo và tiếp xúc với sản phẩm.
Vì qui trình “lựa chọn bắt buộc” được sử dụng, nên các kết quả thu được bằng phương pháp này không bị chệch với điều kiện là tuân thủ đầy đủ Điều 7.
Phụ lục A
(Qui định)
Các bảng
A.1 Xác định sự khác nhau có thể cảm nhận được hoặc tính tương đồng
Xem Bảng A.1 đến A.3.
Bảng A.1 – Số lượng tối thiểu các câu trả lời đúng cần thiết để kết luận rằng có sự khác nhau cảm nhận được, dựa trên phép thử so sánh cặp đôi một phía [2]) [3])
n |
a |
n |
a |
||||||||
0,20 |
0,10 |
0,05 |
0,01 |
0,001 |
0,20 |
0,10 |
0,05 |
0,01 |
0,001 |
||
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 |
7 8 8 9 10 10 11 11 12 12 13 13 14 15 15 16 16 17 17 18 18 19 19 20 20 21 |
8 9 9 10 10 11 12 12 13 13 14 14 15 16 16 17 17 18 18 19 20 20 21 21 22 22 |
9 9 10 10 11 12 12 13 13 14 15 15 16 16 17 18 18 19 19 20 20 21 22 22 23 23 |
10 10 11 12 12 13 14 14 15 15 16 17 17 18 19 19 20 20 21 22 22 23 24 24 25 25 |
10 11 12 13 13 14 15 16 16 17 18 18 19 20 20 21 22 22 23 24 24 25 26 26 27 27 |
36 37 38 39 40 44 48 52 56 60 64 68 72 76 80 84 88 92 96 100 104 108 112 116 120 |
22 22 23 23 24 26 28 30 32 34 36 38 41 43 45 47 49 51 53 55 57 59 61 64 66 |
23 23 24 24 25 27 29 32 34 36 38 40 42 45 47 49 51 53 55 57 60 62 64 66 68 |
24 24 25 26 26 28 31 33 35 37 40 42 44 46 48 51 53 55 57 59 61 64 66 68 70 |
26 27 27 28 28 31 33 35 38 40 42 45 47 49 51 54 56 58 60 63 65 67 69 71 74 |
28 29 29 30 31 33 36 38 40 43 45 48 50 52 55 57 59 62 64 66 69 71 73 76 78 |
CHÚ THÍCH 1 Các giá trị trong bảng là chính xác bởi vì chúng được dựa trên sự phân bố nhị thức. Đối với các giá trị n không nằm trong Bảng này thì có thể thu được giá trị gần đúng theo cách sau đây: Số lượng tối thiểu câu trả lời đúng
(x) bằng số nguyên gần nhất lớn hơn trong đó z thay đổi theo hàm số mức có nghĩa như sau: 0,84 đối với a = 0,20; 1,28 đối với a = 0,10; 1,64 đối với a = 0,05; 2,33 đối với a = 0,01; 3,09 đối với a = 0,001. CHÚ THÍCH 2 Các giá trị n < 18 thường không được khuyến cáo để sử dụng trong các phép thử cặp đôi khác nhau. |
Bảng A.2 – Số lượng tối thiểu các câu trả lời đồng thuận cần thiết để kết luận rằng có sự khác nhau cảm nhận được, dựa trên phép thử so sánh cặp đôi hai phía 2) 3)
n |
a |
n |
a |
||||||||
0,20 |
0,10 |
0,05 |
0,01 |
0,001 |
0,20 |
0,10 |
0,05 |
0,01 |
0,001 |
||
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 |
8 9 9 10 10 11 12 12 13 13 14 14 15 16 16 17 17 18 18 19 20 20 21 21 22 22 |
9 9 10 10 11 12 12 13 13 14 15 15 16 16 17 18 18 19 19 20 20 21 22 22 23 23 |
9 10 10 11 12 12 13 13 14 15 15 16 17 17 18 18 19 20 20 21 21 22 23 23 24 24 |
10 11 11 12 13 13 14 15 15 16 17 17 18 19 19 20 20 21 22 22 23 24 24 25 25 26 |
11 12 13 14 14 15 16 17 17 18 18 19 20 21 21 22 23 23 24 25 25 26 27 27 28 |
36 37 38 39 40 44 48 52 56 60 64 68 72 76 80 84 88 92 96 100 104 108 112 116 120 |
23 23 24 24 25 27 29 32 34 36 38 40 42 45 47 49 51 53 55 57 60 62 64 66 68 |
24 24 25 26 26 28 31 33 35 37 40 42 44 46 48 51 53 55 57 59 61 64 66 68 70 |
25 25 26 27 27 29 32 34 36 39 41 43 45 48 50 52 54 56 59 61 63 65 67 70 72 |
27 27 28 28 29 31 34 36 39 41 43 46 48 50 52 55 57 59 62 64 66 68 71 73 75 |
29 29 30 31 31 34 36 39 41 44 46 48 51 53 56 58 60 63 65 67 70 72 74 77 79 |
CHÚ THÍCH 1 Các giá trị trong bảng là chính xác bởi vì chúng được dựa trên sự phân bố nhị thức. Đối với các giá trị n không nằm trong Bảng này thì có thể thu được giá trị gần đúng theo cách sau đây: Số lượng tối thiểu câu trả lời đúng
(x) bằng số nguyên gần nhất lớn hơn trong đó z thay đổi theo hàm số mức có nghĩa như sau: 1,28 đối với a = 0,20; 1,64 đối với a = 0,10; 1,96 đối với a = 0,05; 2,58 đối với a = 0,01; 3,29 đối với a = 0,001. CHÚ THÍCH 2 Các giá trị n < 18 thường không được khuyến cáo để sử dụng trong các phép thử cặp đôi khác nhau. |
Bảng A.3 – Số lượng tối đa các câu trả lời đúng hoặc câu trả lời đồng thuận cần thiết để kết luận rằng hai mẫu giống nhau, dựa trên phép thử so sánh cặp đôi [4])[5])
n |
b |
pd |
n |
b |
pd |
||||||||
10% |
20% |
30% |
40% |
50% |
10% |
20% |
30% |
40% |
50% |
||||
18 |
0,001 0,01 0,05 0,10 0,20 |
– – – – – |
– – – – – |
– – – – 9 |
– – – 9 10 |
– – 9 10 11 |
48 |
0,001 0,01 0,05 0,10 0,20 |
– – – – – |
– – – – 25 |
– – 25 26 27 |
– 25 27 28 30 |
25 28 30 31 33 |
24 |
0,001 0,01 0,05 0,10 0,20 |
– – – – – |
– – – – – |
– – – 12 13 |
– – 12 13 14 |
– 12 13 14 15 |
54 |
0,001 0,01 0,05 0,10 0,20 |
– – – – – |
– – – 27 28 |
– – 28 30 31 |
– 29 31 32 34 |
29 32 34 35 37 |
30 |
0,001 0,01 0,05 0,10 0,20 |
– – – – – |
– – – – 15 |
– – – 15 16 |
– – 16 17 18 |
– 16 17 18 20 |
60 |
0,001 0,01 0,05 0,10 0,20 |
– – – – – |
– – – 30 32 |
– 32 33 35 |
– 33 35 36 38 |
33 36 38 40 41 |
36 |
0,001 0,01 0,05 0,10 0,20 |
– – – – – |
– – – – 18 |
– – 18 19 20 |
– 18 20 21 22 |
– 20 22 23 24 |
66 |
0,001 0,01 0,05 0,10 0,20 |
– – – – – |
– – – 34 35 |
– 33 35 37 39 |
– 36 39 40 42 |
37 40 43 44 46 |
42 |
0,001 0,01 0,05 0,10 0,20 |
– – – – – |
– – – – 22 |
– – 21 22 24 |
– 21 23 25 26 |
21 24 26 27 28 |
72 |
0,001 0,01 0,05 0,10 0,20 |
– – – – – |
– – – 37 39 |
– 36 39 41 42 |
37 40 43 44 46 |
40 44 47 48 50 |
78 |
0,001 0,01 0,05 0,10 0,20 |
– – – – – |
– – 39 40 42 |
– 40 43 44 46 |
40 44 47 48 50 |
44 48 51 53 54 |
108 |
0,001 0,01 0,05 0,10 0,20 |
– – – – 54 |
– – 55 57 60 |
54 57 61 63 65 |
59 63 67 68 71 |
65 69 72 74 76 |
84 |
0,001 0,01 0,05 0,10 0,20 |
– – – – – |
– – 42 44 46 |
– 43 46 48 50 |
44 48 51 52 54 |
48 53 55 57 59 |
114 |
0,001 0,01 0,05 0,10 0,20 |
– – – – 57 |
– – 59 61 63 |
57 61 65 67 69 |
63 67 71 72 75 |
69 73 77 79 81 |
90 |
0,001 0,01 0,05 0,10 0,20 |
– – – – 45 |
– – 45 47 49 |
– 47 50 52 54 |
48 52 55 56 58 |
53 57 60 61 63 |
120 |
0,001 0,01 0,05 0,10 0,20 |
– – – – 60 |
– – 62 64 67 |
61 65 68 70 73 |
67 71 75 77 79 |
73 78 81 83 85 |
96 |
0,001 0,01 0,05 0,10 0,20 |
– – – – 48 |
– – 49 50 53 |
– 50 54 55 58 |
52 56 59 60 62 |
57 61 64 66 68 |
126 |
0,001 0,01 0,05 0,10 0,20 |
– – – – 64 |
– 66 68 70 |
64 68 72 74 76 |
70 75 79 81 83 |
77 82 85 87 89 |
102 |
0,001 0,01 0,05 0,10 0,20 |
– – – – 51 |
– – 52 54 56 |
– 54 57 59 61 |
55 59 63 64 67 |
61 65 68 70 72 |
132 |
0,001 0,01 0,05 0,10 0,20 |
– – – – 67 |
_ 65 69 71 73 |
67 72 76 78 80 |
74 79 83 85 87 |
81 86 90 92 94 |
CHÚ THÍCH 1 Các giá trị trong bảng là chính xác bởi vì chúng được dựa trên sự phân bố nhị thức. Đối với các giá trị n không nằm trong Bảng này. tính giới hạn tin cậy trên 100(1 – b) % đối với pd, như sau:
[2(x/n) – 1] + 2 x zb x trong đó x là số câu trả lời đúng hoặc đồng thuận, n là số người đánh giá và zb thay đổi như sau: 0,84 đối với b= 0,20; 1,28 đối với b = 0,10; 1,64 đối với b = 0,05; 2,33 đối với b = 0,01; 3,09 đối với b = 0,001. Nếu giá trị tính được thấp hơn giới hạn đã chọn trước của pd thì công bố rằng các mẫu là tương đồng ở mức ý nghĩa b. CHÚ THÍCH 2 Các giá trị n < 30 thường không được khuyến cáo để sử dụng trong các phép thử cặp đôi tương đồng. CHÚ THÍCH 3 Các giá trị tương ứng với số câu trả lời đúng dưới n/2 không được đề cập trong Bảng này. Chúng được mã hóa bằng kí hiệu -. |
A.2 Cách tiếp cận thống kê để xác định số lượng người đánh giá trên cơ sở Bảng A.4 (phép thử một phía) và A.5 (phép thử hai phía)
Độ nhạy thống kê của phép thử phụ thuộc vào ba giá trị: rủi ro a, rủi ro b và tỷ lệ tối đa cho phép của “phân biệt” pd [6]). Trước khi bắt đầu phép thử, chọn các giá trị a, b và pd sử dụng các hướng dẫn sau đây:
Theo nguyên tắc chung, kết quả có ý nghĩa về thống kê đối với rủi ro a:
– giữa 10 % và 5 % (0,10 đến 0,05) cho thấy có bằng chứng (mức độ nhẹ) về sự khác nhau;
– giữa 5 % và 1 % (0,05 đến 0,01) cho thấy có bằng chứng (mức độ vừa) về sự khác nhau;
– giữa 1 % và 0,1 % (0,01 đến 0,001) cho thấy có bằng chứng (mức độ cao) về sự khác nhau và
– dưới 0,1 % (<0,001) cho thấy có bằng chứng chắc chắn về sự khác nhau.
Đối với rủi ro b, thì mức độ của bằng chứng rằng không có sự khác nhau được đánh giá bằng cách sử dụng cùng chuẩn cứ như qui định ở trên (thay “có” bằng “không”).
Tỷ lệ tối đa cho phép của “phân biệt” pd được chia thành ba dải:
– pd < 25 % thể hiện các giá trị nhỏ;
– 25 % < pd < 35 % thể hiện các giá trị trung bình và
– pd > 35 % thể hiện các giá trị lớn.
Chọn số lượng người đánh giá sao để thu được mức độ nhạy yêu cầu cho phép thử. Nhận biết trong Bảng A.4 phần tương ứng với giá trị pd được chọn và cột tương ứng với giá trị b được chọn, số lượng tối đa yêu cầu đối với người đánh giá được để trong dòng tương ứng với giá trị a được chọn. Cách khác, có thể sử dụng Bảng A.4 để xây dựng một tập hợp các giá trị a, b và pd mà có thể cho độ nhạy chấp nhận được trong khi số lượng người đánh giá còn lại nằm trong các giới hạn thực tế. Cách tiếp cận này được nêu chi tiết trong [4].
Bảng A.4 – Số lượng người đánh giá cần thiết cho phép thử cặp đôi một phía [7]) [8])
a |
|
b |
|||||
0,50 |
0,20 |
0,10 |
0,05 |
0,01 |
0,001 |
||
0,50 0,20 0,10 0,05 0,01 0,001 |
pd = 50 % |
–a – – 13 35 38 |
– 12 19 23 40 61 |
– 19 26 33 50 71 |
9 26 33 42 59 83 |
22 39 48 58 80 107 |
33 58 70 82 107 140 |
0,50 0,20 0,10 0,05 0,01 0,001 |
pd = 40 % |
– – 14 18 35 61 |
– 19 28 37 64 95 |
9 30 39 53 80 117 |
20 39 53 67 96 135 |
33 60 79 93 130 176 |
55 94 113 132 174 228 |
0,50 0,20 0,10 0,05 0,01 0,001 |
pd = 30 % |
– – 21 30 64 107 |
– 32 53 69 112 172 |
23 49 72 93 143 210 |
33 68 96 119 174 246 |
59 110 145 173 235 318 |
108 166 208 243 319 412 |
0,50 0,20 0,10 0,05 0,01 0,001 |
pd = 20 % |
– 21 46 71 141 241 |
23 77 115 158 252 386 |
45 112 168 213 325 479 |
67 158 214 268 391 556 |
133 253 322 392 535 731 |
237 384 471 554 726 944 |
0,50 0,20 0,10 0,05 0,01 0,001 |
pd= 10% |
– 81 170 281 550 961 |
75 294 461 620 1007 1551 |
167 451 658 866 1301 1908 |
271 618 861 1092 1582 2248 |
539 1006 1310 1583 2170 2937 |
951 1555 1905 2237 2927 3812 |
a Các ô trống ứng với các trường hợp không cho bất kỳ một sự quan tâm nào (các giá trị cao đối với a và b có tính đến giá trị pd được chọn). |
Bảng A.5 – Số lượng người đánh giá cần thiết cho phép thử cặp đôi hai phía 8) [9])
a |
|
b |
|||||
0,50 |
0,20 |
0,10 |
0,05 |
0,01 |
0,001 |
||
0,50 0,20 0,10 0,05 0,01 0,001 |
pd = 50 % |
–a – – 17 26 42 |
– 19 23 30 44 66 |
– 26 33 42 57 78 |
23 33 42 49 66 90 |
33 48 58 67 87 117 |
52 70 82 92 117 149 |
0,50 0,20 0,10 0,05 0,01 0,001 |
pd = 40 % |
– – 18 25 44 48 |
– 28 37 49 73 102 |
25 39 53 65 92 126 |
33 53 67 79 108 147 |
54 79 93 110 144 188 |
86 113 132 149 191 240 |
0,50 0,20 0,10 0,05 0,01 0,001 |
pd = 30 % |
– 21 30 44 73 121 |
29 53 69 90 131 188 |
44 72 93 114 164 229 |
63 96 119 145 195 267 |
98 145 173 199 261 342 |
156 208 243 276 345 440 |
0,50 0,20 0,10 0,05 0,01 0,001 |
pd = 20 % |
– 46 71 101 171 276 |
63 115 158 199 291 425 |
98 168 213 263 373 520 |
135 214 268 327 446 604 |
230 322 392 455 596 781 |
352 471 554 635 796 1010 |
0,50 0,20 0,10 0,05 0,01 0,001 |
pd = 10 % |
– 170 281 390 670 1090 |
240 461 620 801 1167 1707 |
393 658 866 1055 1493 2094 |
543 861 1092 1302 1782 2440 |
910 1310 1583 1833 2408 3152 |
1423 1905 2237 2544 3203 4063 |
a Các ô trống ứng với các trường hợp không cho bất kỳ một sự quan tâm nào (các giá trị cao đối với a và b có tính đến giá trị pd được chọn). |
Phụ lục B
(Tham khảo)
Các ví dụ
B.1 Ví dụ 1 – Phép thử so sánh cặp đôi một phía để khẳng định rằng có sự khác nhau liên quan đến cường độ của thuộc tính giữa hai mẫu
B.1.1 Nội dung
Theo một số ghi nhận của khách hàng, một số sửa đổi về công nghệ đã được thực hiện để tạo ra bánh qui giòn hơn so với sản phẩm thường dùng. Trước khi tiến hành thử nghiệm trên diện rộng với sự tham gia của khách hàng, thì bộ phận phát triển phải chắc chắn rằng các thay đổi công nghệ đưa ra có được hiệu quả như mong muốn. Với mong muốn để hạn chế rủi ro về sự khác nhau. Mặt khác, vì có khả năng thay đổi công nghệ nên sẵn sàng chấp nhận rủi ro cao về sự không phát hiện được sự khác nhau hiện có.
B.1.2 Mục tiêu phép thử
Mục tiêu là để để khẳng định rằng sản phẩm mới là giòn hơn thực sự. Do đó đây là trường hợp đối với phép thử một phía.
B.1.3 Số lượng người đánh giá
Để tránh cho bộ phận phát triển sản phẩm không đưa ra kết luận sai về vị, thì người giám sát phân tích cảm quan đề nghị một ngưỡng a bằng 0,05, phần trăm người đánh giá phát hiện có sự khác nhau pd bằng 30 % và b bằng 0,50. Do đó cần tham khảo Bảng A.4 và tìm thấy là cần ít nhất 30 người đánh giá.
B.1.4 Kiểm soát phép thử
Ba mươi đĩa bánh qui “A” (kiểm chứng) và 30 đĩa bánh qui “B” (nguyên mẫu) được mã hóa bằng các số thống nhất ngẫu nhiên. Đối với 15 người đánh giá, các sản phẩm được thể hiện theo thứ tự AB, đối với 15 người đánh giá còn lại sản phẩm được thể hiện theo BA. Bảng chấm điểm mẫu được nêu trong Hình B.1.
B.1.5 Phân tích và diễn giải các kết quả
Hai mốt người đánh giá chỉ định mẫu B là giòn hơn. Đối chiếu với Bảng A.1 trong hàng ngang tương ứng với n = 30 và cột dọc a = 0,05, có thể thấy rằng 20 câu trả lời theo hướng mong đợi đáp ứng được sự công bố rằng 2 mẫu khác nhau đáng kể.
B.1.6 Báo cáo và kết luận
Người phân tích cảm quan ghi lại trong báo cáo mẫu ban đầu giòn hơn, với hội đồng (n = 30, x = 21) ở mức ý nghĩa 5 %. Do đó, bánh qui có thể được sản xuất với qui trình mới để đáp ứng sự mong muốn của khách hàng.
Phép thử cặp đôi Tên:…………………………… Mã số đánh giá:…………………… Ngày, tháng………………….. Hướng dẫn Thử nếm hai mẫu bắt đầu từ mẫu phía bên tay trái của bạn. Chỉ rõ mã số của mẫu cho thấy giòn nhất vào phần trống dưới đây. Nếu bạn không chắc chắn, bạn có thể chỉ rõ trong phần “Nhận xét” rằng đó chỉ là phỏng đoán: Mẫu giòn nhất là:………………………………………………………………………………………………. Nhận xét nếu có:……………………………………………………………………………………………….. ……………………………………………………………………………………………………………………… ……………………………………………………………………………………………………………………… ……………………………………………………………………………………………………………………… |
Hình B.1 – Bảng chấm điểm cho ví dụ 1
B.2 Ví dụ 2 – Phép thử so sánh cặp đôi một phía để khẳng định hai mẫu giống nhau liên quan đến thuộc tính đã cho
B.2.1 Nội dung
Nhà sản xuất biết rằng sản phẩm có thể chứa một lượng nhỏ của thành phần làm mất mùi thơm thảo mộc của sản phẩm. Do đó nhà sản xuất muốn xác định lượng tối đa có thể chấp nhận được sao cho sự khác nhau về mùi so với sản phẩm đối chứng không chứa thành phần này (T) đủ để cảm nhận được và do đó không có sự đáng tiếc nào xảy ra tiếp theo.
B.2.2 Mục tiêu phép thử
Mục tiêu là để xác định lượng tối đa của thành phần sao cho sự khác của mùi thảo mộc với sản phẩm đối chứng không chứa thành phần này đủ để cảm nhận được và do đó không có sự đáng tiếc nào xảy ra tiếp theo.
B.2.3 Số lượng người đánh giá
Nhà sản xuất hy vọng sự rõ ràng hợp lý của các yêu cầu liên quan đến lượng cho phép của thành phần làm mất mùi thơm thảo mộc. Do đó, trong phép thử này thì rủi ro không phát hiện được sự khác nhau trong mùi thảo mộc (b) cần được giữ càng thấp càng tốt. Rủi ro a kết luận sai về mùi khi khác nhau thực sự không có, là không quan trọng lắm, vì điều này chỉ có thể dẫn đến yêu cầu bảo toàn lớn hơn. Do đó, b cố định = 0,05, a = 0,50 và phần trăm người đánh giá phát hiện có sự khác nhau pd = 20 %. Do đó, nhà sản xuất tra cứu Bảng A.4 và thấy cần đến ít nhất là 67 người đánh giá. Tuy nhiên, trên bảng tra cứu A.3, cho thấy rằng đối với các giá trị được chọn b và pd, thì số người đánh giá tối đa cần đến là 78 người để có thể sử dụng bảng (trong trường hợp dưới 78 người, thì số lượng tối đa đúng được đưa ra hoặc các câu trả lời đồng thuận là cơ hội thấp, nghĩa là n/2 và do đó không nêu trong bảng). Do đó nhà sản xuất quyết định thành lập hội đồng mới gồm 78 người đánh giá.
B.2.4 Kiểm soát phép thử
Nồng độ đích C được xác định, có tính đến các phép thử ban đầu và sự hiểu biết trước đó. Hai dung dịch được chuẩn bị và mỗi dung dịch được chia thành 78 cốc được mã hóa bằng các số ngẫu nhiên thống nhất. Đối với 39 người đánh giá, các sản phẩm được trình bày theo trật tự TC, còn đối với 39 người đánh giá còn lại thì các sản phẩm được trình bày theo trật tự CT. Bảng chấm điểm mẫu được nêu trong Hình B.1 nhưng câu hỏi so sánh các mẫu được thay bằng “mùi thảo mộc”.
B.2.5 Phân tích và diễn giải các kết quả
78 người đánh giá tham gia vào phép thử này. Bốn mươi mốt người đánh giá chỉ ra mẫu C thơm hơn. Trong Bảng A.3 có thể cho thấy rằng đối với n = 78, pd = 20 và b = 0,05 thì giá trị tối đa kết luận rằng các mẫu giống nhau bằng 39. Vì số câu trả lời đúng thu được trong quá trình thử nghiệm cao hơn giá trị này, nên người phân tích báo cáo rằng không thể đưa ra kết luận về sự giống nhau của mùi giữa các mẫu.
B.2.6 Báo cáo và kết luận
Người phân tích cảm quan ghi lại trong báo cáo rằng nồng độ C là quá mạnh để có thể chấp nhận thành giá trị dung sai cho phép và khuyến cáo thử nghiệm nồng độ hơi thấp hơn.
B.3 Ví dụ 3 – Phép thử so sánh cặp đôi hai phía để khẳng định rằng có sự khác nhau liên quan đến cường độ của thuộc tính giữa hai mẫu
B.3.1 Nội dung
Nhà chế biến xúp muốn xác định hai thành phần cơ bản của natri cho cường độ của vị mặn. Thành phần này sẽ được chọn từ công thức hình thành sản phẩm mới vì nó có thể được sử dụng ở nồng độ nhẹ hơn và sẽ rẻ hơn (cả hai sản phẩm đòi hỏi cùng một giá cho một kilogam). Nếu không có sự khác nhau đáng kể, thì các thành phần khác có thể được thử nghiệm.
B.3.2 Mục tiêu phép thử
Mục tiêu là để xác định xem trong hai thành phần thì thành phần nào cho cường độ của vị mặn mạnh hơn khi có cùng nồng độ. Do đó, đây là trường hợp đối với phép thử hai phía.
B.3.3 Số lượng người đánh giá
Người phân tích cảm quan muốn chắc chắn 95 % rằng tỷ lệ những người đánh giá cao sẽ có thể cảm nhận được sự khác nhau, đo đó a cố định = 0,05 và pd = 50 %. Tuy nhiên, khi kết luận sai rằng không có sự khác nhau sẽ dẫn đến các chi phí bổ sung vì sẽ phải thử nghiệm thêm các thành phần khác. Tiếp đó, người phân tích cảm quan cố định b bằng 0,10. Trên Bảng A.5 có thể thấy rằng cần đến ít nhất 42 người đánh giá. Do đó, quyết định thành lập hội đồng gồm 44 thành viên.
B.3.4 Kiểm soát phép thử
Chuẩn bị hai dãy xúp A và xúp B, chúng khác nhau hoàn toàn về thành phần tạo vị mặn. Hai mẫu này được chuẩn bị ở trạng thái nóng đựng trong các bát gốm đã được mã hóa bằng các số ngẫu nhiên thống nhất. Đối với 22 người đánh giá, các sản phẩm được thể hiện theo thứ tự AB, đối với 22 người đánh giá còn lại sản phẩm được thể hiện theo BA. Bảng chấm điểm mẫu được nêu trong Hình B.2.
B.3.5 Phân tích và diễn giải các kết quả
Bốn mươi bốn người đánh giá tham gia vào phép thử này. Ba mươi hai người đánh giá chỉ ra mẫu A mặn hơn và 12 người đánh giá chỉ ra mẫu B mặn hơn. Trong Bảng A.2 có thể cho thấy rằng đối với n = 44, cột dọc a = 0,05 thì có thể thấy rằng số cao nhất của người đánh giá thu được cho A hoặc B phải cao hơn hoặc bằng 29 để có thể công bố 2 mẫu khác nhau đáng kể. Bảng A.2 cũng cho thấy giá trị lớn hơn hoặc bằng 31 có nghĩa là sự khác nhau đáng kể ở ngưỡng 1 % có thể được kết luận.
B.3.6 Báo cáo và kết luận
Người phân tích cảm quan ghi lại trong báo cáo rằng thành phần A cảm nhận được mặn hơn so với thành phần B ở ngưỡng 1 %. Do đó, trong tương lai thành phần A được chấp nhận để sản xuất.
Hình B.2 – Bảng chấm điểm cho Ví dụ 3
B.4 Ví dụ 4 – Phép thử so sánh cặp đôi hai phía để khẳng định hai mẫu giống nhau liên quan đến thuộc tính đã cho
B.4.1 Nội dung
Nhà sản xuất chất dẻo đã sử dụng, cụ thể là sản xuất chắn bùn ôtô, để tiết kiệm, họ thay chất làm trơn thông thường bằng loại mới, nhưng không muốn công thức của chất dẻo mới này có thể cảm nhận được bề mặt trơn hơn hoặc kém hơn so với loại thông thường.
B.4.2 Mục tiêu phép thử
Mục tiêu là để xác định xem ở cùng một nồng độ thì liệu chất làm trơn mới có cho “bề mặt trơn” như sản phẩm thông thường hay không.
B.4.3 Số lượng người đánh giá
Nhà sản xuất hy vọng rằng thành phần mới cho cùng một mức “bề mặt trơn” cảm nhận được như loại chất làm trơn thông thường. Do đó, trong phép thử này thì rủi ro không phát hiện được sự khác nhau về độ trơn bề mặt (b) cần được giữ càng thấp càng tốt. Rủi ro a kết luận sai về “bề mặt trơn” khi sự khác nhau thực sự không có, là không quan trọng lắm, vì điều này chỉ có thể dẫn đến việc giữ lại chất bôi trơn thường dùng đắt hơn. Do đó, b cố định = 0,05, a = 0,10 và phần trăm người đánh giá phát hiện có sự khác nhau pd = 30 %. Do đó, nhà sản xuất tra cứu Bảng A.5 và thấy cần đến ít nhất là 119 người đánh giá. Để cân đối các thứ tự thể hiện, quyết định thành lập hội đồng mới gồm 120 người đánh giá.
B.4.4 Kiểm soát phép thử
Chuẩn bị hai tấm chất dẻo A và B, chúng khác nhau hoàn toàn về chất làm trơn. Hai tấm mẫu này được cho vào hai hộp được mã hóa bằng các số ngẫu nhiên thống nhất. Đối với 60 người đánh giá, các sản phẩm được thể hiện theo thứ tự AB, đối với 60 người đánh giá còn lại sản phẩm được thể hiện theo BA. Bảng chấm điểm mẫu được nêu trong Hình B.3.
B.4.5 Phân tích và diễn giải các kết quả
Hội đồng gồm 120 người đánh giá tham gia vào phép thử này. Trong đó có 67 thành viên chỉ ra mẫu A có bề mặt trơn hơn và 53 thành viên chỉ ra mẫu B có bề mặt trơn hơn. Trong Bảng A.3 có thể cho thấy rằng đối với n = 120, hàng ngang với b = 0,05 và pd = 30 % thì tìm được giá trị 68. Vì số câu trả lời cao nhất thu được trong quá trình thử nghiệm bằng 67 thấp hơn giá trị này (68), nên có thể đưa ra kết luận rằng có sự giống nhau giữa hai mẫu ở khoảng tin cậy 95 % và ở mức pd đã chọn cho phép thử.
B.4.6 Báo cáo và kết luận
Người phân tích cảm quan ghi lại trong báo cáo rằng chất làm trơn mới cho mức độ trơn bề mặt giống như chất làm trơn thường dùng và trong tương lai chất làm trơn mới này có thể được chọn để sản xuất.
Phép thử cặp đôi |
Tên…………………… Mã số của người đánh giá:…………… Ngày, tháng……………………
Hướng dẫn: Bạn hãy so sánh 2 mẫu trên quan điểm đặc trưng về độ trơn bề mặt. Tấm có bề mặt trơn hơn là tấm không cho thấy cản trở nào khi sờ tay lên bề mặt của tấm này. Bạn hãy sờ vào cả hai sản phẩm, bắt đầu từ tấm phía bên trái và quan sát như sau: chuyển động lòng bản tay áp nhẹ từ trái sang phải. Chọn mẫu có bề mặt trơn nhất và nhận dạng bằng cách đánh dấu chéo vào ô tương ứng. 192 □ 526 □ |
Hình B.3 – Bảng chấm điểm cho Ví dụ 4
B.5 Ví dụ 5 – Khoảng tin cậy đối với các phép thử cặp đôi
B.5.1 Nội dung
Nếu muốn, người phân tích có thể tính khoảng tin cậy trên tỷ lệ của những người đánh giá thực tế để có thể phân biệt 2 mẫu (nghĩa là được hiệu chỉnh về khả năng). Các phép tính được dựa trên khoảng gần đúng của phân bố chuẩn như sau, trong đó x là số câu trả lời theo hướng mong đợi (phép thử một phía) hoặc số lượng câu trả lời đồng thuận (phép thử hai phía) và n là tổng số câu trả lời:
– pc (tỷ lệ câu trả lời mong đợi hoặc câu trả lời đồng thuận) = x/n
– (tỷ lệ phân biệt khác nhau) = 2 pc – 1
– sd (sai số chuẩn của ) =
– giới hạn tin cậy trên = + zasd
– giới hạn tin cậy dưới = – zasd
trong đó za, là giá trị tới hạn của phân bố chuẩn đã được chuẩn hóa được đưa ra trong Bảng sau đây:
Mức |
Phép thử |
|
za một phía |
za hai phía |
|
80% |
0,84 |
1,28 |
90% |
1,28 |
1,64 |
95% |
1,64 |
1,96 |
99% |
2,33 |
2,58 |
99,9 % |
3,10 |
3,29 |
B.5.2 Phân tích và diễn giải các kết quả
Trong Ví dụ 3 (phép thử sự khác nhau so sánh cặp đôi hai phía), thu được số liệu như sau: n = 44, x = 32, a = 0,05 và b = 0,10:
– pc = x/n = 32/44 = 0,73
– (tỷ lệ phân biệt khác nhau)= 2 pc – 1 = 2 x 0,73 – 1 = 0,45
– sd (sai số chuẩn của ) =
– 95 % giới hạn tin cậy trên = + zasd = 0,45 + 1,96 x 0,134 = 0,71
– 95 % giới hạn tin cậy dưới = – zasd = 0,45 – 1,96 x 0,134 = 0,19
Do đó, người phân tích cảm quan có thể chắc chắn 95 % rằng ít nhất 19 % người dân có thể phân biệt được sự khác nhau giữa các mẫu. Kết quả này phù hợp với kết luận đưa ra trong Ví dụ 3, cho thấy mẫu A mặn hơn vì cho thấy khoảng tin cậy không chứa giá trị “không” và nằm ngoài giới hạn ban đầu ấn định cho phép thử (pc = 50 %).
Trong Ví dụ 4 (phép thử tính tương đồng so sánh cặp đôi hai phía), thu được số liệu như sau: n = 120, a = 0,10 và b = 0,05:
– pc = x/n = 67/120 = 0,56
– (tỷ lệ phân biệt khác nhau) = 2 pc – 1 = 2 x 0,56 – 1 =0,12
– sd (sai số chuẩn của ) =
– 95 % giới hạn tin cậy trên = + zasd= 0,12 + 1,96 x 0,09 = 0,29
– 95 % giới hạn tin cậy dưới = – zasd = 0,12 – 1,96 x 0,09 = -0,06
Do đó, người phân tích cảm quan có thể chắc chắn 95 % rằng tỷ lệ có thể phân biệt được sự khác nhau giữa các mẫu không quá 29 %.
Tính đồng thời, các khoảng tin cậy cho phép sai số 5 % đối với các giới hạn trên và giới hạn dưới, do đó, người phân tích cảm quan có thể chắc chắn 90 % rằng tỷ lệ phân biệt sự khác nhau từ 0 % đến 29 %. Giá trị này thấp hơn các giới hạn ấn định ban đầu (pd = 30 %). Do đó, người phân tích có thể kết luận rằng không có sự khác nhau có thể cảm nhận được giữa các mẫu.
THƯ MỤC TÀI LIỆU THAM KHẢO
[1] ENNIS, D.M. and Bi, J. The Beta-Binomial Model: Accounting for Inter-trial Variation in Replicated Difference and Preference Tests. Journal of Sensory Studies, 13, No. 4,1998, pp. 389-412
[2] BROCKHOFF, P.B. and SCHLICH, P. Handling replications in discrimination tests. Food Quality and Preference, 9, No. 5, 1998, pp. 303-312
[3] FRIJTERS, J.E.R. Three-Stimulus Procedure in Olfactory Psycholophysics: An Experimental Comparison of Thurstone-Ura and Three-Alternative Forced-Choice Models of Signal Detection Theory. Perception and Psychophysics, 28, No. 5,1980, pp. 390-397
[4] SCHLICH, P. Risk Tables for Discrimination Tests. Food Quality and Preference,4,1993, pp. 141-151
[5] KUNERT, J. and MEYNERS, M. On the triangle test with replications. Food Quality and Preference, 10,1999
[6] KUNERT, J. On repeated difference testing. Food Quality and Preference, 12, 2001, pp 385-391
[7] MACRAE, A. Confidence intervals for the triangular test. Food Quality and Preference, 6, 1995, pp.61-67
[8] ISO 3534-1, Statistics – Vocabulary and symbols – Part 1: Probability and general statistical terms.
[1] Trong tiêu chuẩn, “tương đồng” (similar) không có nghĩa là “đồng nhất” (identical). Thuật ngữ này biểu thị rằng hai sản phẩm hoàn toàn giống nhau có thể sử dụng thay thế nhau. Điều này không có nghĩa là hai sản phẩm đồng nhất. Tuy nhiên, điều đó cũng có thể cho thấy giữa hai sản phẩm có sự khác nhau quá nhỏ đến mức không đáng kể trong thực tế.
[2] Các giá trị đưa ra trong Bảng này tính được tứ công thức đúng của phân bố nhị thức đối với thông số p = 0,5 với n lần lặp lại theo phần mềm SAS trong [4].
[3] Các giá trị tương ứng với số câu trả lời đúng tối thiểu yêu cầu để có ý nghĩa tại mức a đã nêu (cột dọc) đối với số lượng người đánh giá tương ứng, n (hàng ngang). Loại bỏ việc khẳng định “không có sự khác nhau’ nếu số lượng câu trả lời đúng lớn hơn hoặc bằng giá trị nêu trong bảng.
[4] ) Các giá trị đưa ra trong Bảng này nhờ chương trình tính toán các khoảng tin cậy từ công thức đúng của phân bố nhị thức trong [7].
[5] Các giá trị này ứng với số lượng tối đa câu trả lời đúng hoặc câu trả lời đồng thuận yêu cầu cho “tính tương đồng” ở các mức pd. b và n đã chọn. Chấp nhận “không có sự khác nhau” ở mức 100(1 – b) % mức tin cậy nếu số câu trả lời đúng hoặc câu trả lời đồng thuận ít hơn hoặc bằng giá trị nêu trong bảng.
[6] Trong tiêu chuẩn này, xác suất của một câu trả lời đúng, pc, được tính theo công thức pc = 1 x pd + (1/2) x (1 – pd), trong đó pd là tỉ lệ người đánh giá có thể phân biệt hai mẫu. Mô hình lượng hóa tâm Ií của quá trình ra quyết định của người đánh giá, ví dụ như mô hình Thurstone-Ura [3] có thể được áp dụng cho phép thử cặp đôi.
[7] Các giá trị đưa ra trong Bảng này được lấy từ [4] hoặc tính được từ công thức đúng của qui luật phân bố nhị thức đối với thông số p = 0,5 với n câu trả lời dựa vào phầm mềm SAS trong tài liệu tham khảo này.
[8] Các giá trị ứng với số lượng tối thiểu của người đánh giá cần thiết để thực hiện phép thử cặp đối với độ nhạy được xác định bằng các giá trị pd. a và b. Nhận biết trong bảng phần ứng với giá trị đã chọn pd, cột dọc ứng với giá trị b được chọn. Đọc số lượng tối thiểu người đánh giá trên hàng ngang ứng với giá trị a được chọn.
[9] Các giá trị đưa ra trong Bảng này tính được từ công thức đúng của qui luật phân bố nhị thức đối với thông số p = 0,5 với n câu trả lời dựa vào phầm mềm SAS trong [4].
TIÊU CHUẨN QUỐC GIA TCVN 4831: 2009 (ISO 5495 : 2005) VỀ PHÂN TÍCH CẢM QUAN – PHƯƠNG PHÁP LUẬN – PHÉP THỬ SO SÁNH CẬP ĐÔI | |||
Số, ký hiệu văn bản | TCVN4831:2009 | Ngày hiệu lực | |
Loại văn bản | Tiêu chuẩn Việt Nam | Ngày đăng công báo | |
Lĩnh vực |
Lĩnh vực khác |
Ngày ban hành | |
Cơ quan ban hành | Tình trạng | Còn hiệu lực |
Các văn bản liên kết
Văn bản được hướng dẫn | Văn bản hướng dẫn | ||
Văn bản được hợp nhất | Văn bản hợp nhất | ||
Văn bản bị sửa đổi, bổ sung | Văn bản sửa đổi, bổ sung | ||
Văn bản bị đính chính | Văn bản đính chính | ||
Văn bản bị thay thế | Văn bản thay thế | ||
Văn bản được dẫn chiếu | Văn bản căn cứ |