TIÊU CHUẨN QUỐC GIA TCVN 11183:2015 (ISO 8587:2006 WITH AMENDMENT 1:2013) VỀ PHÂN TÍCH CẢM QUAN – PHƯƠNG PHÁP LUẬN – XẾP HẠNG

Hiệu lực: Còn hiệu lực Ngày có hiệu lực: 31/12/2015

TIÊU CHUẨN QUỐC GIA

TCVN 11183:2015

ISO 8587:2006 WITH AMENDMENT 1:2013

PHÂN TÍCH CẢM QUAN – PHƯƠNG PHÁP LUẬN – XẾP HẠNG

Sensory analysis  Methodology  Ranking

Lời nói đầu

TCVN 11183:2015 hoàn toàn tương đương với ISO 8587:2006 và bản sửa đổi 1:2013;

TCVN 11183:2015 do Ban kỹ thuật tiêu chuẩn quốc gia TCVN/TC/F13 Phương pháp phân tích và lấy mẫu biên soạn, Tổng cục Tiêu chuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ công bố.

 

PHÂN TÍCH CẢM QUAN – PHƯƠNG PHÁP LUẬN – XẾP HẠNG

Sensory analysis  Methodology  Ranking

1  Phạm vi áp dụng

Tiêu chuẩn này quy định phương pháp đánh giá cảm quan với mục tiêu sắp xếp dãy mẫu thử theo thứ tự.

Phương pháp này cho phép đánh giá sự khác biệt giữa một số mẫu dựa trên cưng độ của một thuộc tính đơn l, của một số thuộc tính 1) hoặc của một cảm giác tổng thể. Phương pháp này được dùng để xác định sự khác biệt nếu có, nhưng không thể xác định mức độ của sự khác biệt giữa các mẫu.

Phương pháp này thích hợp trong các trường hợp sau:

a) đánh giá năng lực của người thử cảm quan

1) huấn luyện người thử;

2) xác định ngưng cảm nhận của các cá nhân hay của cả nhóm;

b) đánh giá sản phẩm

1) sắp xếp sơ bộ mẫu

i) theo một tiêu chí mô tả,

ii) theo thị hiếu;

2) xác định ảnh hưởng đến các mức cường độ của một hoặc nhiều ch tiêu (ví dụ như thứ tự của độ pha loãng, ảnh hưng của nguyên liệu thô, của phương thức sản xuất, đóng gói hoặc bảo quản)

i) theo một tiêu chí mô t,

ii) theo thị hiếu;

3) xác định thứ tự ưu tiên trong phép thử th hiếu toàn diện.

2  Tài liệu viện dẫn

Các tài liệu viện dẫn sau rất cần thiết cho việc áp dụng tiêu chuẩn này. Đối với các tài liệu viện dẫn ghi năm công bố thì áp dụng phiên bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất, bao gồm c các sa đi, bổ sung (nếu có).

TCVN 8244-1 (ISO 3534-1), Thống kê học – Từ vựng và kí hiệu – Phần 1: Thuật ngữ chung về thống kê và thuật ngữ dùng trong xác sut

TCVN 11182 (ISO 5492), Phân tích cảm quan – Thuật ngữ và định nghĩa

ISO 6658, Sensory analysis – Methodology – General guidance (Phân tích cảm quan – Phương pháp luận – Hướng dẫn chung)

ISO 8586-1:1993 *), Sensory analysis – General guidance for the selection, training and monitoring of assessors – Part 1: Selected assessors (Phân tích cảm quan – Hướng dn chung đối với việc lựa chọn, hun luyện và giám sát người th– Phần 1: Người th được lựa chọn)

ISO 8586-2 *)Sensory analysis – General guidance for the selection, training and monitoring of assessors – Part 2: Experts (Phân tích cảm quan – Hướng dẫn chung đối với việc lựa chọn, huấn luyện và giám sát người thử- Phần 2: Chuyên gia)

ISO 8589, Sensory analysis – General guidance for the design of test rooms (Phân tích cảm quan – Hướng dẫn chung đối với việc thiết kế phòng thử nghiệm)

ISO 11035, Sensory analysis – Identification and selection of descriptors for establishing a sensory profile by a multidimensional approach (Phân tích cảm quan – Xác định và lựa chọn các thuật ngữ mô tả đối với việc thiết lập đặc tính cảm quan theo cách tiếp cận đa chiều)

ISO 11036, Sensory analysis – Methodology – Texture profile (Phân tích cảm quan – Phương pháp luận – Đặc tính cấu trúc)

3  Thuật ngữ và định nghĩa

Trong tiêu chuẩn này, áp dụng các thuật ngữ và định nghĩa nêu trong TCVN 11182 (ISO 5492) và TCVN 8244-1 (ISO 3534-1).

4  Nguyên tắc

Người thử nhận đồng thời ba mẫu hoặc nhiều hơn theo thứ tự ngẫu nhiên.

CHÚ THÍCH: Đối với việc xếp hạng hai mu thì phương pháp so sánh cặp đôi theo mô tả trong TCVN 4831 (ISO 5495)[1] thường được chọn hơn.

Người thử được yêu cầu xếp hạng các mẫu theo các tiêu chí cụ thể: tiêu chí một chiều (nghĩa là thuộc tính cụ thể hoặc đặc tính cụ thể của một thuộc tính) hoặc cường độ toàn phần (cảm giác tổng thể).

Xác định thứ tự tổng th và thực hiện so sánh thống kê.

5  Điều kiện thử nghiệm chung

Khi có thể, tham chiếu các tiêu chun (xem ISO 6658) mô tả phương pháp lấy mu, phòng thử nghiệm (xem ISO 8589) và thiết bị, dụng cụ.

Khi chuẩn bị mẫu thử, cần xem xét các điểm quan trọng sau đây:

a) việc chuẩn bị, mã hóa và trình bày mẫu thử;

b) số lượng các mẫu có thể so sánh được một cách đáng tin cậy [xác định dựa trên bản cht của sn phm (các hiệu ứng bão hòa cảm giác)] và thiết kế được chọn; số lượng mẫu phải được lấy dựa trên:

1) loại sản phẩm [ví dụ: người thử được lựa chọn (ISO 8586-1) hoặc chuyên gia (ISO 8586-2) có thể đánh giá đến 15 mẫu đơn giản, trong khi người tiêu dùng chỉ có thể đánh giá tối đa 03 mẫu sản phm hăng/chát, cay hoặc cha hàm lượng chất béo cao], và

2) tiêu chí đánh giá (ví dụ: vị ngọt thì ít bão hòa hơn vị đắng);

c) độ chiếu sáng đối với các mẫu.

6  Người thử

6.1  Trình độ

Trình độ của người thử phụ thuộc vào mục tiêu của phép thử (xem Phụ lục A).

Tất c người thử tốt nhất nên có cùng trình độ, mức này được chọn dựa theo mục đích của phép thử:

a) người thử được lựa chọn hoặc chuyên gia, để:

1) huấn luyện người thử,

2) đánh giá dựa trên tiêu chí mô t, ví dụ xác định nhanh tác động của mức cường độ của một hoặc nhiều chỉ tiêu (ví dụ: thứ tự độ pha loãng, ảnh hưởng của nguyên liệu thô, của phương pháp sản xuất, đóng gói hoặc bo quản),

3) xác định ngưng cảm nhận của các cá nhân hoặc của nhóm;

b) người thử chưa qua huấn luyện hoặc người tiêu dùng, đã được huấn luyện về phương pháp:

1) để thực hiện phép thử thị hiếu ưu tiên,

2) khi sắp xếp sơ bộ các mu (để lựa chọn một vài sản phm từ số lượng lớn sản phẩm, như là phép thử sơ bộ).

Các điều kiện mà người thử phải tuân thủ được nêu trong ISO 6658, ISO 8586-1 và ISO 8586-2. Người thử phải được huấn luyện về quy trình xếp hạng và các từ mô tả được chọn để sử dụng.

6.2  S lượng người thử

S lượng người thử phụ thuộc vào mục tiêu của phép thử (xem Phụ lục A).

Khi kiểm tra năng lực của người thử, huấn luyện người thử hoặc xác định ngưng cảm giác của các cá nhân hay các nhóm thì không yêu cầu số lượng tối thiểu hay tối đa.

Đi với đánh giá mô tả sản phẩm, số lượng ngưởi thử tối thiểu được xác định qua mức độ của rủi ro thống kê chấp nhận được và phải phù hợp với ISO 11035 hoặc ISO 11036, tốt nht chọn lấy từ 12 đến 15 người thử.

Đối với xác định thứ tự ưu tiên trong phép thử th hiếu, số lượng người thử tối thiểu được xác định qua mức độ ri ro thống kê chấp nhận được, ví dụ tối thiểu 60 người thử cho mỗi nhóm người tiêu dùng.

Đối với phân tích thống kê các kết quả, khi các yếu tố khác là tương đương (ví dụ: các điều kiện thử nghiệm, trình độ của người thử), số lượng người thử càng lớn thì xác suất phát hiện các sai khác có tính hệ thống càng lớn khi xếp hạng các sản phm.

6.3  Thảo luận sơ bộ

Người thử phải được thông báo về mục đích của phép thử, nghĩa là việc xếp hạng các mẫu thử.

Nếu cần, có thể thực hiện một minh họa của quy trình xếp hạng. Trong phép thử này, điều quan trọng là đm bo tất cả người thử đều có nhận thức chung về các tiêu chí của phép thử. Việc thảo luận sơ bộ không được tác động đến kì vọng của những người thử.

7  Cách tiến hành

7.1  Trình bày mu

Các mẫu phải được trình bày sao cho người thử không thể đưa ra kết luận về mẫu.

Chuẩn b mẫu ngoài tầm nhìn của người thử và theo cách thống nhất: cùng thiết bị, dụng cụ, cùng lượng sản phẩm, cùng nhiệt độ và cùng cách trình bày. Tt cả sự khác biệt không thích hợp giữa các mẫu phải được che giấu để tránh tác động đến việc xếp hạng. Nên trình bày mẫu  nhiệt độ sử dụng sản phẩm.

Dụng cụ đựng mẫu được nhận dạng bởi tổ hợp 3 chữ số, các số này được chọn ngẫu nhiên và khác nhau giữa các mẫu trong một buổi đánh giá (và tốt nhất là khác nhau giữa những người thử).

Việc trình bày phải tính đến thiết kế đã chọn. Trong một thiết kế “khi hoàn chnh, mỗi người thử xếp hạng tất cả các mẫu. Đây là quy trình thưng được chọn. Nhưng nếu số lượng mẫu hoặc bản chất của mẫu dẫn đến việc không thể xếp hạng tất c các mẫu thì có thể sử dụng thiết kế “khối không hoàn chỉnh đã cân bằng. Trong trường hợp đó, cn đảm bảo rằng mọi người thử hoàn thành phần công việc nêu trong thiết kế và không b qua bất kì đánh giá nào.

Đối với thiết kế khối không hoàn chỉnh đã cân bằng, mỗi người thử được giới thiệu một tập con các mẫu theo thứ tự ngẫu nhiên (xem ví dụ trong Phụ lục C).

CHÚ THÍCH: Việc sử dụng một khối không hoàn chnh đã cân bng ch khả thi nếu trong thực tế tồn tại dao động khối. Vì vậy, cần tìm được tài liệu về khối xác đnh trước, ví dụ Tài liệu tham khảo [5] trong Thư mục tài liệu tham khảo.

Mỗi người thử được giới thiệu k trong số p mẫu (k < p). Tập con k mu được xác định sao cho khi một phần tử thuộc thiết kế khối không hoàn chnh đã cân bằng, mỗi mẫu được đánh giá bởi n trong số j người thử (n < j) và mỗi cặp mẫu được đánh giá bởi g người thử. Có thể cần lặp lại toàn bộ thiết kế khối không hoàn chnh đã cân bng vài lần để đạt được mức trung bình về độ nhạy trong phép xác định. Số lần lặp lại được kí hiệu là r. Tổng cộng, mỗi mẫu được đánh giá bởi r n người thử và mỗi cặp mẫu được đánh giá bởi r g người thử.

7.2  Mẫu chuẩn

Có thể dùng mẫu chuẩn. Khi đó, các mẫu chun được bố trí lẫn trong dãy mẫu thử.

7.3  Kỹ thuật thử nghiệm

Tất cả người thử phải thực hiện trong cùng điều kiện thử nghiệm.

Người thử sẽ đánh giá mẫu được trình bày theo thứ tự ngẫu nhiên và xếp chúng theo thứ tự với thuộc tính định sẵn.

Hướng dẫn người thử tránh đồng nhất các thứ hạng2). Nếu một người thử không thể phân biệt hai hoặc nhiều mẫu thì hướng dn người thử xếp các mẫu theo thứ tự và ghi lại các mẫu không th phân biệt trong phần ghi chú của phiếu tr lời.

Việc bố trí mẫu không được gây n hiện tượng thích nghi cảm giác và các sản phm đủ ổn định, có thể cần hướng dẫn mỗi người thử thực hiện xếp hạng sơ bộ, sau đó khẳng định lại thứ tự này bằng cách đánh giá lại các mẫu theo thứ tự xếp hạng.

Một thuộc tính đơn phải được đánh giá bởi một phép thử riêng. Nếu cần thông tin về việc xếp hạng nhiều thuộc tính thì mỗi thuộc tính phải được đánh giá bằng một phép thử riêng.

7.4  Phiếu trả lời

Ví dụ về phiếu tr lời được nêu trong Phụ lục D.

Mã s mu không nên thể hiện trong phiếu trả lời trắng trong trường hợp vị trí của chúng ảnh hưởng đến k vọng của người thử về thứ tự xếp hạng. Các thứ tự được gán cho các mẫu đơn lẻ phải được người thử ghi lại vào phiếu trả li.

Tùy theo mục đích của phép thử và tùy thuộc mẫu thử, có thể cần ghi lại các thông tin b sung vào phiếu trả lời cụ thể.

8  Biểu thị và diễn giải kết quả

8.1  Tổng hợp kết qu và tính thứ hng chung

Bng 1 minh họa cho việc xếp hạng một thuộc tính bởi bảy người thử trên bốn mẫu. Nếu thực hiện xếp hạng liên quan đến nhiều thuộc tính thì cần lập bảng riêng cho từng thuộc tính.

Nếu có thứ hạng đồng nhất thì ghi lại thứ hạng trung bình của mẫu bị đồng nhất. Trong Bng 1, người thử số 2 đã gán cùng thứ hạng cho mẫu B và mẫu C. Người thử số 3 đã gán cùng thứ hạng cho mẫu B, mẫu C và mẫu D.

Nếu dữ liệu không bị sót và nếu thứ hạng bị đồng nhất được tính đúng thì các hàng sẽ có cùng tổng. Thứ hạng chung đối với mỗi mẫu thu được bằng cách b sung thứ hạng trong mỗi cột. Các tổng thứ hạng cho thấy tính đồng nhất của thứ hạng được gán bởi toàn bộ nhóm người thử. Nếu tương thích thì các tổng thứ hạng sẽ rất khác nhau, nhưng nếu không tương thích thì các tổng thứ hạng sẽ tương tự nhau.

8.2  Phân tích thng kê và diễn giải

Kiểm định thống kê được chọn phụ thuộc vào mục đích của phép thử (xem Phụ lục A).

8.2.1  Xác định năng lực cá nhân: hệ số tương quan Spearman

Đ xác định sự thống nhất giữa hai thứ tự xếp hạng (ví dụ: việc xếp hạng giữa hai người thử hoặc thứ tự xếp hạng của một người thử và thứ tự dự đoán qua thông tin về mẫu), hệ số tương quan Spearman, rs, có thể tính như sau:

trong đó:

p là số lượng sản phẩm được xếp hạng;

di là chênh lệch giữa hai thứ hạng của mẫu thử i.

Nếu giá trị của hệ số tương quan Spearman gần sát với +1 thì có sự thống nhất cao giữa hai thứ tự xếp hạng. Nếu giá trị này gần bng 0 thì các thứ hạng đó không liên quan với nhau.

Nếu giá trị nêu trên gần sát với -1 thì các thứ tự xếp hạng rất không thống nhấtCần xem xét khả năng một người thử hiểu sai hướng dẫn và xếp mẫu theo thứ tự ngược với chủ tâm của họ.

Giá trị tới hạn của rs cần xác định nếu sự tương quan quan sát được là đáng kể, được nêu trong Bảng 2.

8.2.2  Xác định năng lực nhóm trong trường hợp th tự mẫu dự tính trước hoặc khẳng định thứ tự mẫu dự tính trước: Kim định Page [3]

Phép phân tích này có thể dùng để xác định liệu hội đồng đánh giá có thống nhất, hoặc có thể cm nhn được, với thứ hạng theo một số tính chất mà tập hợp mẫu đã biết hoặc được dự báo s có.

Nếu Γ1 …Γp là tng thứ hạng lý thuyết của p mẫu trong thứ tự dự tính trước, giả thuyết không về sự không khác biệt giữa các mẫu có thể được viết thành: H0: Γ1 =… = Γp

Giả thuyết thay thế là: H1Γ1 ≤ … ≤ Γp, trong đó ít nhất một bất đẳng thức là đúng.

Đối với mọi sản phẩm, tổng thứ hạng R1, …. Rp được tính (trong đó R1 là tổng thứ hạng của mẫu đầu tiên trong thứ tự xếp hạng đã biết, và tiếp tục đến Rp đối với mu cuối cùng của th tự đã biết).

Để kiểm tra gi thuyết không, H0, tính hệ số Page L:

L = R1 + 2R2 + 3R3 + … + p·Rp

Hệ số này là cao nhất nếu xếp hạng lý thuyết của các sản phẩm là tái lập bởi những người thử.

Trong trường hợp các thiết kế khối hoàn chnh, so sánh L với các giá trị tới hạn trong Bảng 3, tương ứng với số lượng người thử, số lượng mẫu và ri ro đã chọn, đối với α = 0,05 hoặc α = 0,01.

– Nếu L nhỏ hơn giá tr tra bảng thì tìm thấy sự khác biệt giữa các sn phm.

– Nếu L bằng hoặc lớn hơn giá trị tra bảng thì có sự khác biệt đáng kể giữa các tổng thứ hạng của các sn phm. H0 không được chấp nhận và H1 được chấp nhận. Kết luận rng người thử có xu hướng xếp hạng mẫu theo thứ tự định trước.

Nếu số lượng người thử hoặc số lượng mẫu không tra được từ Bảng 3, tính:

trong đó:

p là s lượng sản phẩm được xếp hạng;

j là số lượng người thử.

Số lượng này xấp x phân bố chuẩn.

H0 không được chp nhận nếu L’ ≥ 1,64 ( mức rủi ro 0,05) hoặc L’ ≥ 2,33 ( mức rủi ro 0,01) (xem Bảng 3).

Trong trường hợp các thiết kế khối không hoàn chỉnh cân bằng, tính:

trong đó:

p là tổng số lượng sản phẩm được xếp hạng;

k là số lượng sản phẩm được từng người thử xếp hạng;

j là số lượng người thử.

Số lượng này cũng xp x phân bố chuẩn.

H0 không được chấp nhận nếu L ≥ 1,64 (ở mức rủi ro 0,05) hoặc L ≥ 2,33 ( mức rủi ro 0,01) (xem Bảng 3).

Do trong giả thuyết H0 các tổng thứ hạng lý thuyết là bằng nhau, kết quả đáng kể không cho biết tất cả sự khác biệt giữa các mẫu là nhận biết được, duy ch có sự khác biệt giữa ít nhất một cặp mẫu được nhận biết nht quán trong thứ tự đã dự đoán.

8.2.3  So sánh các sản phẩm khi chưa có thứ tự giả đnh

Kiểm định Friedman (Phân tích phương sai bằng cách xếp hạng) [2] là phương tiện tốt nhất để minh chứng nhận thức của những người thử về sự khác biệt giữa các mẫu.

8.2.3.1  Kim định khi có sự khác biệt giữa ít nht hai sn phm

Kiểm định này áp dụng khi j người thử cùng xếp hạng p sản phẩm.

Tính thứ hạng của các tổng R1R2, …, Rp của p mẫu thông qua j người thử.

Nếu Γ1, …,Γp là th tự lý thuyết của các tổng của p mẫu thì giả thuyết không về sự không khác biệt giữa các mẫu có thể biểu thị như sau:

H0: Γ1 = … = Γp

Giả thuyết thay thế là không phải tất c các tổng thứ hạng của tập hợp đu bằng nhau.

Đối với các thiết kế khi hoàn chỉnh, giá trị kiểm định Friedman là:

Fthử = 

trong đó Ri là tng thứ hạng của sản phẩm thứ i.

Nếu Fthử > F thì từ Bảng 4 xem xét số người thử, số sn phẩm và rủi ro được chọn, H0 b bác bỏ. Kết luận là có sự khác biệt giữa thứ tự xếp hạng của các sản phm.

Đối với các thiết kế khối không hoàn chỉnh đã cân bằng:

Fthử = 

trong đó:

Ri là tổng thứ hạng của sản phi;

r là số lần lặp lại của thiết kế khối không hoàn chnh đã cân bằng cơ bản;

k là số mẫu mà mỗi người thử xếp hạng;

n là số lần mà mỗi mẫu được đánh giá trong thiết kế khối không hoàn chỉnh đã cân bằng cơ bản;

g là số ln mi cặp mẫu được đánh giá cùng nhau trong thiết kế khối không hoàn chỉnh đã cân bng cơ bản.

Nếu Fthử > F thì từ Bảng 4 xem xét số người thử, s sản phẩm  rủi ro lựa chọn, H0 bị bác b. Kết luận là có sự khác biệt giữa thứ tự xếp hạng của các sản phẩm.

Nếu số mẫu hoặc s người thử không tra được trong Bng 4 thì tính các giá trị tới hạn bng cách lấy xp x từ xử lý Fthử vì c2 với p – 1 bậc tự do, trong đó p là số sản phm. Giá trị tới hạn của c2 được tra từ Bng 5.

8.2.3.2  Kim định đối với các sản phẩm có sự khác biệt đáng kể so vi các sản phẩm khác

Nếu kiểm định Friedman cho phép kết luận rằng có sự khác biệt nhất quán giữa các thứ tự xếp hạng sản phẩm thì tính ch số khác biệt có ý nghĩa nhỏ nhất (LSD) ở mức ri ro lựa chọn (α = 0,05 hoặc α = 0,01) đ xác định những sản phm nào khác biệt có nghĩa.

Khi xem xét mức α (mức ý nghĩa, hoặc rủi ro của việc kết luận rằng không có sự khác biệt), phải chọn một trong hai cách tiếp cận sau đây:

a) Nếu mức rủi ro áp dụng đi với mỗi cặp riêng lẻ thì rủi ro liên quan đến α. Ví dụ: với ri ro α = 0,05 (nghĩa là rủi ro 5 %) thì trong công thức tính LSD, giá trị của z (tương ứng với xác suất chun hai phía của α) là 1,96. Trường hợp này là rủi ro riêng l. Nếu rủi ro đối với mỗi cặp là α thì có một rủi ro đối với việc gán sai khác biệt đáng kể đối với một hoặc nhiều cặp trong thí nghiệm tổng thể, rủi ro này lớn hơn nhiều so với α.

b) Nếu rủi ro α áp dụng đối với thí nghiệm tổng thể thì rủi ro liên quan đến mỗi cặp sản phm là α’, trong đó α’ = 2 α/[p(p – 1)]. Ví dụ: khi p – 8,  mức rủi ro α = 0,05 thì α’ = 0,001 8 và khi đó z (tương ứng với xác suất chuẩn hai phía của α’) là 2,91. Đây là thí nghiệm đúng hay là rủi ro tổng thể.

Trong hầu hết các trường hợp, điểm thứ hai nêu trên, tức là ri ro thí nghiệm đúng, hầu như đều liên quan đến các quyết định thực tế về sản phẩm.

Đối với các thiết kế khối hoàn chỉnh:

Đối với các thiết kế khối không hoàn chnh đã cân bằng:

Nếu khác biệt quan sát được giữa các tổng thứ hạng của hai sản phẩm bng hoặc lớn hơn LSD thì kết luận rằng hai sản phẩm có thứ hạng khác nhau đáng kể.

Nếu khác biệt quan sát được là nhỏ hơn LSD thì hai sản phẩm không có thứ hạng khác biệt đáng kể.

8.2.4  Xếp hạng đng nht

Nếu hai hoặc nhiều hơn hai thứ hạng là trùng nhau thì F trong các thiết kế khi hoàn chỉnh được thay bằng F’:

trong đó:

E là giá trị thu được như sau:

Đặt n1n2,…, nk là số thứ hạng trùng nhau trong mỗi nhóm th hạng đồng nht:

Ví dụ: trong Bảng 1 có hai nhóm thứ hạng đồng nhất:

– nhóm thứ nhất bắt đầu từ người thử 2 (hai mẫu B và C là đồng nhất vì n1 = 2);

– nhóm thứ hai bắt đầu t người thử 3 (ba mẫu B, C và D là đồng nhất vì n2 = 3).

Do đó:

E = (23 – 2) + (33 – 3) = 6 + 24 = 30

Vì j = 7 và p = 4, thực hiện kiểm định, có F được tính, sử dụng giá trị:

Sau đó so sánh F với các giá trị tới hạn trong Bảng 4 và Bảng 5.

8.2.5  So sánh hai sản phẩm: Kiểm định du

Trong trường hợp đặc biệt chỉ xếp hạng hai sản phẩm, có thể s dụng kiểm định dấu.

CHÚ THÍCH: Trong trường hợp này, phép thử so sánh cặp đô[TCVN 4831 (ISO 5495)] là phép th thích hợp hơn.

Khi  hai sản phẩm A và B, nếu kA là số cách sắp xếp sản phẩm A  thứ hạng đầu tiên và kB là số cách sắp xếp sản phẩm B  thứ hạng đầu tiên, đặt k nhỏ hơn kA hoặc kB.

Tất c kết quả “không khác biệt sẽ được b qua.

Giả thuyết không là:

H0KA = KB

trong đó KA và KB là số lần lý thuyết mà các sản phẩm A và B được xếp  vị trí đầu trong toàn bộ mẫu.

(“Giả thuyết không” phát biểu rằng A và B được xếp hạng như nhau trong toàn bộ mẫu.)

Giả thuyết thay thế là:

H0KA ≠ KB

(“Gi thuyết thay thế” phát biểu rằng A và B được xếp hạng khác nhau trong toàn bộ mẫu.)

Nêu k nh hơn giá trị tới hạn trong Bảng 6 đối với lượng đánh giá thực tế, H0 bị bác b và có th kết luận rng A và B có thứ hạng khác nhau đáng kể.

9  Báo cáo thử nghiệm

Báo cáo thử nghiệm phi bao gồm các thông tin sau:

a) mục đích của phép thử;

b) mọi thông tin cần thiết để nhận diện đầy đủ về mẫu thử

1) số lượng mẫu,

2) mẫu chuẩn, nếu sử dụng;

c) các thông số thử đã được chấp nhận

1) số lượng người thử và năng lực của họ,

2) môi trường thử nghiệm,

3) các điều kiện vật liệu;

d) các kết qu thu được, cùng với phần diễn giải thống kê;

e) viện dẫn tiêu chuẩn này;

f) những sai lệch so với tiêu chuẩn này;

g) tên của người giám sát phép thử;

h) ngày và thời điểm thực hiện phép thử.

Bng 1 – Tổng hợp kết quả và tính tổng thứ hạng

Người thử

Mẫu

Tng thứ hạng

A

B

C

D

1

2

3

4

5

6

7

1

4

1

1

3

2

2

2

1,5

3

3

1

1

1

3

1,5

3

4

2

3

4

4

3

3

2

4

4

3

10

10

10

10

10

10

10

Tng thứ hạng đối với mẫu

14

12,5

20,5

23

70

CHÚ THÍCH: Do mỗi người thử được n định cùng bộ thứ hạng nên tng các hàng là như nhau và bng 0,5 p(p +1), trong đó p là số lượng mẫu.

Bng 2 – Giá trị tới hạn đối với hệ s tương quan Spearman

Số lượng mẫu

Mức ý nghĩa (α)

α = 0,05

α = 0,01

6

0,886

7

0,786

0,929

8

0,738

0,881

9

0,700

0,833

10

0,648

0,794

 

 

 

11

0,618

0,755

12

0,587

0,727

13

0,560

0,703

14

0,538

0,675

15

0,521

0,654

16

0,503

0,635

17

0,485

0,615

18

0,472

0,600

19

0,460

0,584

20

0,447

0,570

 

 

 

21

0,435

0,556

22

0,425

0,544

23

0,415

0,532

24

0,406

0,521

25

0,398

0,511

26

0,390

0,501

27

0,382

0,491

28

0,375

0,483

29

0,368

0,475

30

0,362

0,467

Bng 3 – Các giá trị tới hạn của kiểm định Page trong trường hợp thiết kế khối hoàn chnh

Số người thử

Số lượng mẫu (hoặc sản phẩmp

3

4

5

6

7

8

3

4

5

6

7

8

Mức ý nghĩa

α = 0,05

Mức ý nghĩa

α = 0,01

7

8

9

10

11

12

13

14

15

16

17

18

19

20

91

104

116

128

141

153

165

178

190

202

215

227

239

251

189

214

240

266

292

317

343*

368*

394*

420*

445*

471*

496*

522*

338

384

431

477

523

570

615*

661*

707*

754*

800*

846*

891*

937*

550

625

701

777

852

928

1003*

1078*

1153*

1228*

1303*

1378*

1453*

1528*

835

950

1065

1180

1295

1410

1525*

1639*

1754*

1868*

1982*

2097*

2217*

2325*

1204

1371

1537

1703

1868

2035

2201*

2367*

2532*

2697*

2862*

3028*

3193*

3358*

93

106

119

131

144

156

169

181

194

206

218

231

243

256

193

220

246

272

298

324

350*

376*

402*

427*

453*

479*

505*

531*

346

393

441

487

534

584

628*

674*

721*

767*

814*

860*

906*

953*

563

640

717

793

869

946

1022*

1098*

1174*

1249*

1325*

1401*

1476*

1552*

855

972

1088

1205

1321

1437

1553*

1668*

1784*

1899*

2014*

2130*

2245*

2360*

1232

1401

1569

1736

1905

2072

2240*

2407*

2574*

2740*

2907*

3073*

3240*

3406*

CHÚ THÍCH: Các giá trị được đánh dấu sao (*) là các giá trị tới hạn, được tính bng phương pháp xp x, sử dụng phân phi chuẩn.

Bảng 4 – Các giá trị tới hạn (F) đối với kiểm định Friedman (mức rủi ro 0,05 và 0,01)[6]

Số người thử

Số lượng mẫu (hoặc sản phẩm) p

3

4

5

6

7

3

4

5

6

7

 

Mức ý nghĩa

α = 0,05

Mức ý nghĩa

α = 0,01

7

7,143

7,8

9,11

10,62

12,07

8,857

10,371

11,97

13,69

15,35

8

6,250

7,65

9,19

10,68

12,14

9,000

10,35

12,14

13,87

15,53

9

6,222

7,66

9,22

10,73

12,19

9,667

10,44

12,27

14,01

15,68

10

6,200

7,67

9,25

10,76

12,23

9,600

10,53

12,38

14,12

15,79

11

6,545

7,68

9,27

10,79

12,27

9,455

10,60

12,46

14,21

15,89

12

6,167

7,70

9,29

10,81

12,29

9,500

10,68

12,53

14,28

15,96

13

6,000

7,70

9,30

10,83

12,37

9,385

10,72

12,58

14,34

16,03

14

6,143

7,71

9,32

10,85

12,34

9,000

10,76

12,64

14,40

16,09

15

6,400

7,72

9,33

10,87

12,35

8,933

10,80

12,68

14,44

16,14

16

5,99

7,73

9,34

10,88

12,37

8,79

10,84

12,72

14,48

16,18

17

5,99

7,73

9,34

10,89

12,38

8,81

10,87

12,74

14,52

16,22

18

5,99

7,73

9,36

10,90

12,39

8,84

10,90

12,78

14,56

16,25

19

5,99

7,74

9,36

10,91

12,40

8,86

10,92

12,81

14,58

16,27

20

5,99

7,74

9,37

10,92

12,41

8,87

10,94

12,83

14,60

16,30

¥

5,99

7,81

9,49

11,07

12,59

9,21

11,34

13,28

15,09

16,81

CHÚ THÍCH 1: Giá trị F có thể ch là các giá trị gián đoạn, tính gián đoạn sẽ rt rõ rệt đối với các giá trị j và p nh. Do đó, không thể thu được các giá trị tới hạn tương ng hoàn toàn vi các rủi ro 0,05 và 0,01.

CHÚ THÍCH 2: Các giá trị in nghiêng thu được bằng phương pháp xấp x với phân phối c2.

Bảng 5 – Các giá trị tới hạn của phân phối c2 (mức rủi ro: 0,05 và 0,01)

S lượng mẫu (hoặc sản phẩm)

p

S bậc tự do của X2

(v = p -1)

Mức ý nghĩa

α

α = 0,05

α = 0,01

3

2

5,99

9,21

4

3

7,81

11,34

5

4

9,49

13,28

6

5

11,07

15,09

7

6

12,59

16,81

8

7

14,07

18,47

9

8

15,51

20,09

10

9

16,92

21,67

 

 

 

 

11

10

18,31

23,21

12

11

19,67

24,72

13

12

21,03

26,22

14

13

22,36

27,69

15

14

23,68

29,14

16

15

25,00

30,58

17

16

26,30

32,00

18

17

27,59

33,41

19

18

28,87

34,80

20

19

30,14

36,19

 

 

 

 

21

20

31,4

37,6

22

21

32,7

38,9

23

22

33,9

40,3

24

23

35,2

41,6

25

24

36,4

43,0

26

25

37,7

44,3

27

26

38,9

45,6

28

27

40,1

47,0

29

28

41,3

48,3

30

29

42,6

49,6

Bảng 6 – Các giá trị tới hạn đi với kiểm định dấu (hai phía)

Số người thử

(j)

Mức ý nghĩa

Số ngưi thử

(j)

Mức ý nghĩa

α = 0,05

α = 0,01

α = 0,05

α = 0,01

1

 

 

46

15

13

2

 

 

47

16

14

3

 

 

48

16

14

4

 

 

49

17

15

5

 

 

50

17

15

 

 

 

 

 

 

6

0

 

51

18

15

7

0

 

52

18

16

8

0

0

53

18

16

9

1

0

54

19

17

10

1

0

55

19

17

 

 

 

 

 

 

11

1

0

56

20

17

12

2

1

57

20

18

13

2

1

58

21

18

14

2

1

59

21

19

15

3

2

60

21

19

 

 

 

 

 

 

16

3

2

61

22

20

17

4

2

62

22

20

18

4

3

63

23

20

19

4

3

64

23

21

20

5

3

65

24

21

 

 

 

 

 

 

21

5

4

66

24

22

22

5

4

67

25

22

23

6

4

68

25

22

24

6

5

69

25

23

25

7

5

70

26

23

 

 

 

 

 

 

26

7

6

71

26

24

27

7

6

72

27

24

28

8

6

73

27

25

29

8

7

74

28

25

30

9

7

75

28

25

 

 

 

 

 

 

31

9

7

76

28

26

32

9

8

77

29

26

33

10

8

78

29

27

34

10

9

79

30

27

35

11

9

80

30

28

 

 

 

 

 

 

36

11

9

81

31

28

37

12

10

82

31

28

38

12

10

83

32

29

39

12

11

84

32

29

40

13

11

85

32

30

 

 

 

 

 

 

41

13

11

86

33

30

42

14

12

87

33

31

43

14

12

88

34

31

44

15

13

89

34

31

45

15

13

90

35

32

Đối với các giá trị j lớn hơn 90, có th tính các giá trị tới hạn gần đúng bng cách ly số nguyên gần nhất nhỏ hơn , trong đó k bằng 0,980 0 đối vα = 0,05 và bng 1,287 9 đối với α = 0,01.

 

Phụ lục A

(tham kho)

Thiết lập các điều kiện thử nghiệm

Bảng A.1 – Lựa chọn các thông s của phép thử dựa trên mục đích sử dụng

Mục đích của phép thử

Năng lực của người thử

Số lượng người thử

Phương pháp thng kê

So sánh với thứ tự đã biết (thử năng lực người thử)

Chưa biết thứ hạng của sản phẩm (so sánh các sản phẩm)

2 sản phm

> 2 sản phẩm

Đánh giá năng lực cá nhân

Người thử được chọn hoặc chuyên gia thử cm quan được chọn

Không giới hạn

Kiểm định Spearman

Kiểm định dấu

Kim định Friedman

Đánh giá năng lực của nhóm

Người thử được chọn hoặc chuyên gia thử cm quan được chọn

Không giới hạn

Kiểm định Page

Đánh giá sản phẩm theo tiêu chí mô tả

Người thử được chọn hoặc chuyên gia thử cảm quan được chọn

Tốt nhất là từ 12 đến 15

Đánh giá sn phm theo xu hướng thị hiếu

Người tiêu dùng

Tối thiểu 60 mỗi nhóm đối tượng người tiêu dùng (ô và phần)

 

 

Phụ lục B

(tham khảo)

Ví dụ áp dụng thực tế – Thiết kế khối hoàn chỉnh

Các kết qu của mười bốn người thử thực hiện trên một dãy mẫu thử được tổng hợp trong Bng B.1.

Bảng B.1 – Ví dụ về đánh giá

Người thử

Mẫu

A

B

C

D

E

1

2

4

5

3

1

2

4

5

3

1

2

3

1

4

5

3

2

4

1

2

5

3

4

5

1

5

2

3

4

6

2

3

4

5

1

7

4

5

3

1

2

8

2

3

5

4

1

9

1

3

4

5

2

10

1

2

5

3

4

11

4

5

2

3

1

12

2

4

3

5

1

13

5

3

4

2

1

14

3

5

2

4

1

Tổng thứ hạng

33

53

52

45

27

Giá trị Fthử từ kim định Friedman được tính như sau.

Từ j = 14, p = 5, R1 = 33, R2 = 53, R3 = 52, R4 = 45, R5 = 27:

Fthử = 

Giá trị 15,31 lớn hơn giá tr nêu trong Bảng 4 đối với j = 14, p = 5  mức ý nghĩa 0,05 (bằng 9,32); do đó có th kết luận rằng với rủi ro của sai số nh hơn hoặc bằng 5 % thì năm mẫu được cảm nhận khác biệt.

Ngoài ra, cũng có thể kết luận rằng hai mẫu riêng lẻ là khác biệt nếu chênh lệch tuyệt đối giữa các tng thứ hạng của chúng lớn hơn:

 ( mc rủi ro 0,05)

 mức rủi ro 0,05, chênh lệch giữa A  B, A và C, E và B, E và C, E và D là đáng kể, chênh lệch về tng thứ hạng của chúng tương ứng là:

A  B: | 33  53 | = 20                              – B: | 27  53 | = 26

A  C: | 33  52 | = 19                              E  C: | 27  52 | = 25

E – D: | 27  45 | = 18

Phép phân tích cui cùng có thể cho kết quả được biểu thị như sau:

Ý nghĩa của phần gạch chân như sau:

– hai mẫu không kết nối bằng phần gạch chân liền là khác biệt đáng kể (ở mức rủi ro 0,05);

– hai mẫu kết ni bằng phần gạch chân liền là không có khác biệt đáng kể;

– A và E không phân biệt được, được xếp hạng trước đáng kể so với nhóm D, C  B, nhóm này cũng không phân biệt được. Có ba nhóm gồm nhóm chứa A và E, nhóm chứa A  D, nhóm chứa B, D và C.

Trong trường hợp có lý do chính đáng đ gi định tiên nghiệm trước khi thử nghiệm rng: thứ hạng của E  thứ hạng của A ≤ thứ hạng của D ≤ thứ hạng của C ≤ thứ hạng của B

thì có thể dùng phép thử Page để kiểm tra giả thuyết một phía này.

Khi đó, giá trị L trong phép thử Page được tính như sau:

L = (1 x 27) + (2 x 33) + (3 x 45) + (4 x 52) + (x 53) = 701

Giá trị tới hạn từ kim định Page đối với p = 5, j = 14, α = 0,05 là 661 (xem Bng 3).

Vì L lớn hơn 661 nên giả thuyết không đối với việc hoàn toàn không có khác biệt giữa các mẫu  mức rủi ro α = 0,05 b bác bỏ.

Để kết luận đối với ví dụ này:

a) dựa trên kiểm định Friedman

–  mức rủi ro 0,05 , E không khác A; D không khác cả C lẫn B; A không khác D nhưng A khác biệt đáng kể so với C và B; E khác biệt đáng kể so với D, với C và với B;

b) xem xét đến kiểm định Page

– những người thử nhận diện sự khác biệt giữa các mẫu  mức rủi ro α = 0,05; thứ hạng được giả đnh từ trước đã được xác nhận.

 

Phụ lục C

(tham khảo)

Ví dụ áp dụng thực tế – Thiết kế khối không hoàn chỉnh đã cân bằng

Các kết quả của mười người thử thực hiện trên ba trong số năm mẫu thử với thiết kế khối không hoàn chnh đã cân bằng được tổng hợp trong Bảng C.1.

Bng C.1 – Ví dụ v đánh giá

Người thử

Mu

A

B

C

D

E

1

1

2

3

 

 

2

1

2

 

3

 

3

2

3

 

 

1

4

1

 

2

3

 

5

2

 

3

 

1

6

1

 

 

3

2

7

 

1

3

2

 

8

 

2

3

 

1

9

 

3

 

2

1

10

 

 

1

3

2

Tng thứ hạng

8

13

15

16

8

Giá trị Fthử từ kiểm định Friedman được tính như sau.

Từ j = 10p = 5, k = 3, n = 6, g = 3, r = 1, R1 = 8, R2 = 13, R3 = 15, R4 = 16, R5 = 8:

Fthử = 

Giá trị 11,6 lớn hơn giá trị nêu trong Bảng 4 đối với p = 5  mức ý nghĩa 0,05 (bằng 9,25); do đó có thể kết luận rằng với rủi ro của sai lỗi ít hơn hoặc bng 5 % thì năm mẫu có sự khác biệt.

Ngoài ra, cũng có thể kết luận rằng hai mẫu riêng lẻ là khác biệt nếu chênh lệch tuyệt đối giữa các tổng thứ hạng của chúng lớn hơn:

 ( mức rủi ro 0,05)

ở mức rủi ro 0,05, chênh lệch giữa A và C, A và D, C và E, E và C, D và E là đáng kể, chênh lệch về tổng thứ hạng của chúng tương ứng là:

A – C: | 8 – 15 | = 7 C – E: 15 – 81 | = 7

A  D: | 8  16 | = 8 D  E: 16 – 81 | = 8

Phép phân tích cuối cùng có thể cho kết quả được biểu thị như sau:

Trong trường hợp có lý do chính đáng để giả định tiên nghiệm trước khi thử nghiệm rằng:

thứ hạng của E ≤ thứ hạng của A ≤ thứ hạng của D ≤ thứ hạng của ≤ thứ hạng của B

thì có thể dùng phép thử Page để kiểm tra giả thuyết một phía này.

Giá trị L trong phép thử Page được tính như sau:

L = (1 x 8) + (2 x 8) + (3 x 16) + (4 x 15) + (5 x 13) = 197

Vì p = 5, k = 3, j = 10 nên giá trị L trở thành:

Vì L lớn hơn 2,33 nên giả thuyết không v việc hoàn toàn không có khác biệt giữa các mẫu bị bác bỏ  mức rủi ro α = 0,01.

Để kết luận đối với ví dụ này:

a) dựa trên kim định Friedman

–  mức rủi ro 0,05 , tng thứ hạng của A và E nhỏ hơn đáng kể so với C và D. B không có khác biệt đáng kể so với bốn mẫu còn lại;

b) dựa trên kiểm định Page

– những người thử nhận diện sự khác biệt giữa các mẫu  mức rủi ro α = 0,01; thứ hạng được giả đnh trước đã được xác nhận.

 

Phụ lục D

(tham khảo)

Ví dụ về phiếu trả lời

Họ và tên: ………………………….  Ngày:………………………………. – Phép thử số:…………………….

Anh/chị hãy nếm các mẫu từ trải qua phải:

       

Ghi mã số theo thứ tự tăng dần v độ ngọt vào các ô dưới đây:

  Nhỏ nhất     Lớn nht
Mã số        
Ý kiến:

 

THƯ MỤC TÀI LIỆU THAM KHẢO

[1 ] TCVN 4831 (ISO 5495), Phân tích cảm quan – Phương pháp luận – Phép thử so sánh cặp đôi

[2] Friedman, M. The use of ranks to avoid the assumptions of normality implicit in the analysis of variance, Journal of the American Statistical Association32, 1937, pp. 675-701

[3] Page, E.B. Ordered hypotheses for multiple treatments: a significance test for linear ranks, Journal of the American Statistical Association, 58, 1963. pp. 216-230

[4] XP V09-500, Analyse sensorielle – Méthodologie – Directives générales pour la réalisation dépreuves hédoniques en laboratoire dévaluation sensorielle ou en salle en conditions contrôlées impliquant des consommateurs

[5] COCHRAN, W.G. and COX, G.M. Experimental Designs. John Wiley & Sons, Inc., Chapter 11, Balanced Incomplete Blocks, 1950, pp. 315-346

[6] LOTHAR, SApplied Statisticsa Handbook of Techniques, Springer Series in Statistics, Springer- Verlag, 1982



1) Trong trường hợp này, mỗi thuộc tính được th bởi một phép thử khác nhau trên cùng sản phẩm với mã khác nhau và được trình bày với th tự khác nhau đối với cùng một người thử cảm quan.

*) ISO 8566-1:1993 và ISO 8586-2:2008 đã được thay thế bi ISO 8586:2012 Sensory analysis – General guidelines for the selection, training and monitoring of selected and expert assessors (Phân tích cảm quan – Hướng dẫn chung đi với việc lựa chọn, hun luyện và giám sát ngưi thử được chọn và chuyên gia đánh giá).

2) Cần tránh xếp hạng đồng nhất (xếp các mẫu với cùng một thứ hạng), chỉ xếp hạng đồng nhất khi người thử không thể phân biệt các mẫu.

TIÊU CHUẨN QUỐC GIA TCVN 11183:2015 (ISO 8587:2006 WITH AMENDMENT 1:2013) VỀ PHÂN TÍCH CẢM QUAN – PHƯƠNG PHÁP LUẬN – XẾP HẠNG
Số, ký hiệu văn bản TCVN11183:2015 Ngày hiệu lực 31/12/2015
Loại văn bản Tiêu chuẩn Việt Nam Ngày đăng công báo
Lĩnh vực Khoa học - Công nghệ
An toàn thực phẩm
Ngày ban hành 31/12/2015
Cơ quan ban hành Bộ khoa học và công nghê
Tình trạng Còn hiệu lực

Các văn bản liên kết

Văn bản được hướng dẫn Văn bản hướng dẫn
Văn bản được hợp nhất Văn bản hợp nhất
Văn bản bị sửa đổi, bổ sung Văn bản sửa đổi, bổ sung
Văn bản bị đính chính Văn bản đính chính
Văn bản bị thay thế Văn bản thay thế
Văn bản được dẫn chiếu Văn bản căn cứ

Tải văn bản