TIÊU CHUẨN QUỐC GIA TCVN 11777-10:2017 (ISO/IEC 15444-10:2011) VỀ CÔNG NGHỆ THÔNG TIN – HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG 2000 – PHẦN MỞ RỘNG ĐỐI VỚI DỮ LIỆU BA CHIỀU

Hiệu lực: Còn hiệu lực

TIÊU CHUẨN VIỆT NAM

TCVN 11777-10:2017

ISO/IEC 15444-10:2011

CÔNG NGHỆ THÔNG TIN – HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG 2000 – PHẦN MỞ RỘNG ĐỐI VỚI DỮ LIỆU BA CHIỀU

Information technology – JPEG 2000 image coding system: Extensions for three-dimensional data

Lời nói đầu

TCVN 11777-10:2017 hoàn toàn tương đương với ISO/IEC 15444-10:2011.

TCVN 11777-10:2017 do Học viện Công nghệ Bưu chính Viễn thông biên soạn, Bộ Thông tin và Truyền thông đề nghị, Tổng cục Tiêu chuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ công bố.

CÔNG NGHỆ THÔNG TIN – HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG 2000 – PHẦN MỞ RỘNG ĐỐI VỚI DỮ LIỆU BA CHIỀU

Information technology – JPEG 2000 image coding system – Extensions for three-dimensional data

1 Phạm vi áp dụng

Tiêu chuẩn này cung cấp phần mở rộng cho hệ thống mã hóa lõi (ISO/IEC 15444-1) và phần mở rộng (ISO/IEC 15444-2) đối với các tập dữ liệu dạng khối logic. Cụ thể là, tiêu chuẩn vẫn duy trì tất cả các tính năng hiện tại và cú pháp của ISO/IEC 15444-1, và một phần tính năng hiện tại của ISO/IEC15444-2 đối với các ảnh đa thành phần, bên cạnh đó cung cấp các tùy chọn và mở rộng cho một số các tính năng này. Trong các nội dung này, tiêu chuẩn đưa ra đặc tả đẳng hướng cho các tập dữ liệu ba chiều, tức là, đưa ra các tính năng xử lý đồng nhất ở tất cả ba chiều thậm chí cả khi cú pháp dòng mã của ISO/IEC 15444-1 và ISO/IEC 15444-2 khác nhau giữa hai trục không gian và trục thành phần chéo. Các mô hình ngữ cảnh được sử dụng trong tiêu chuẩn này giống các mô hình ngữ cảnh trong ISO/IEC 15444-1 và ISO/IEC 15444-2. Các mô hình ngữ cảnh cải tiến sẽ được giới thiệu trong tài liệu bổ sung.

2 Tài liệu viện dẫn

Các tài liệu viện dẫn sau đây là cần thiết để áp dụng tiêu chuẩn này. Đối với các tài liệu viện dẫn ghi năm công bố thì áp dụng phiên bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất (bao gồm cả các sửa đổi, bổ sung).

ISO/IEC 15444-1:2004, Công nghệ thông tin – Hệ thống mã hóa hình ảnh JPEG 2000: Hệ thống mã hóa lõi (Information technology – JPEG 2000 image coding system: Core coding system).

ISO/IEC 15444-2:2004, Công nghệ thông tin – Hệ thống mã hóa hình ảnh JPEG 2000: Phần mở rộng. (Information technology- JPEG 2000 image coding system: Extensions).

3 Thuật ngữ và định nghĩa

Tiêu chuẩn này sử dụng các thuật ngữ và định nghĩa sau:

3.1

Khối bit 3D (3D bit-block)

Mảng ba chiều của các bit. Trong tiêu chuẩn này, khối bit 3D nói đến tất cả các bit có cùng biên độ ở mọi hệ số hoặc mẫu. Thuật ngữ này có thể nói đến khối bit 3D trong thành phần, khối ảnh-thành phần, khối mã 3D, vùng quan tâm, hoặc các đối tượng khác.

3.2

Khối mã 3D (3D code-block)

Nhóm ba chiều dạng khối chữ nhật của các hệ số từ cùng một băng con của khối ảnh-thành phần.

3.3

Quét khối mã 3D (3D code-block scan)

Thứ tự các hệ số khối mã 3D được truy cập trong quá trình mã hóa. Khối mã 3D được xử lý theo sọc, mỗi sọc gồm bốn hàng (hoặc tất cả các hàng còn lại nếu ít hơn bốn hàng) và trải theo chiều rộng của khối mã 3D. Mỗi sọc được xử lý theo từng cột tính từ cột cao nhất tới thấp nhất và từ trái sang phải. Do vậy, toàn bộ khối mã 3D được quét theo từng lát ảnh. Trong mỗi lát ảnh lại tuân thủ theo ISO/IEC 15444-1.

3.4

Thành phần (component)

Dữ liệu nén từ dòng mã có dạng một tập đơn gồm dữ liệu hai hoặc ba chiều.

3.5

Thiết bị đọc phù hợp (conforming reader)

Ứng dụng dùng để đọc và biên dịch tập tin JP3D một cách chính xác.

3.6

Mức phân tách (decomposition level)

Tập hợp các băng con nơi mà mỗi hệ số đều có cùng tác động theo không gian hoặc trải theo các mẫu gốc. Các băng con này gồm băng con [H|L|X][H|L|X][H|L|X] (ví dụ, LLL, LXL, XXH, …, trừ XXX) được chia theo các mức con phân tách ba chiều.

3.7

Băng con [H|L|X][H|L|X][H|L|X] [H|L|X][H|L|X][H|L|X] (sub-band [H|L|X][H|L|X][H|L|X] [H|L|X][H|L|X][H|L|X])

H nghĩa là lọc thông cao, L nghĩa là lọc thông thấp, X nghĩa là không lọc. Bộ lọc đầu tiên là lọc theo chiều ngang, bộ lọc thứ hai là lọc theo chiều dọc và bộ lọc thứ ba là lọc theo trục (tức là, tương ứng theo các trục X, Y và Z). Việc lập thứ tự lọc cho băng con này phải luôn được lưu ý. Việc phục dựng sẽ thực hiện theo thứ tự lọc đảo ngược.

CHÚ THÍCH: Ở đây không bao gồm băng con XXX (như định nghĩa trong 3.6).

3.8

Ảnh (image)

Tập tất cả các thành phần hai hoặc ba chiều.

3.9

Độ lệch vùng ảnh (image area offset)

Số lượng điểm lưới tọa độ tham chiếu nằm dưới, ở bên phải (và ở một vị trí dọc trục trên) của gốc lưới tọa độ tham chiếu.

3.10

Thành phần trung gian (intermediate component)

Mảng dữ liệu đơn hai hoặc ba chiều tham gia vào giai đoạn biến đổi đa thành phần.

3.11

Thứ tự quét mành (raster order)

Thứ tự riêng theo dãy của dữ liệu có dạng bất kỳ trong mảng. Thứ tự quét mành bắt đầu tại điểm dữ liệu cao nhất bên trái của lát ảnh đầu tiên và chuyển đến điểm dữ liệu ngay bên phải, và tiếp tục như vậy đến cuối hàng. Sau khi đã đến cuối hàng, điểm dữ liệu tiếp theo trong dãy là điểm dữ liệu gần nhất bên trái ngay dưới hàng hiện tại. Thứ tự này cứ tiếp tục như vậy đến cuối của lát ảnh. Sau đó, lát ảnh tiếp theo sẽ được xử lý theo dạng mảng ba chiều. Thứ tự như vậy được tiếp tục đến cuối mảng.

3.12

Phân giải (resolution)

Mối quan hệ không gian của các mẫu theo không gian vật lý. Trong tiêu chuẩn này, các mức phân tách của biến đổi sóng con sẽ tạo nên các phân giải chênh lệch theo lũy thừa hai ở chiều ngang, chiều dọc, hoặc trong trường hợp ba chiều là hướng trục, hoặc mọi sự kết hợp có thể của các hướng. Mức phân tách cuối cùng (cao nhất) gồm một băng con [L|X][L|X][L|X] (lưu ý là không bao gồm XXX), được coi là phân giải thấp hơn. Do vậy, sẽ có hơn một mức phân giải so với số mức phân tách.

3.13

Mức phân giải (resolution level)

Tương đương với mức phân tách, ngoại trừ rằng băng con [L|X][L|X][L|X] cũng là một mức phân giải riêng.

3.14

Mẫu (sample)

Một phần tử trong mảng hai hoặc ba chiều có chứa một thành phần.

3.15

Lát ảnh (slice)

Lát ảnh là một tập hợp con ảnh điểm hai chiều của một thực thể lập thể, khối mã lập thể hoặc ảnh lập thể. Lát ảnh có vị trí trực giao với trục hoặc trục z.

3.16

Hệ tọa độ không gian (spatial coordinates)

Hệ tọa độ không gian được biểu thị bởi các trục x, y và z. Nói chung, thuật ngữ trục sẽ được sử dụng để chỉ chiều Z.

3.17

Băng con (sub-band)

Nhóm các hệ số biến đổi sinh ra từ cùng một chuỗi các quá trình lọc thông thấp và thông cao.

3.18

Bậc băng con (sub-band order)

Trong cùng mức phân giải, các băng con được xử lý và được báo hiệu như xác định trong ISO/IEC 15444-1 và ISO/IEC 15444-2 đối với lọc hai chiều, tuân theo thứ tự quét Morton [1]. Đặc tả được mở rộng cho trường hợp ba chiều trong trường hợp triển khai thứ tự quét Morton ba chiều.

3.19

Khối ảnh (tile)

Mảng hình khối của các điểm nằm trên lưới tọa độ tham chiếu, được biểu thị bằng một độ lệch so với gốc lưới tọa độ tham chiếu và được định nghĩa bởi chiều rộng (chiều x), chiều cao (chiều y) và chiều sâu (chiều z). Các khối ảnh xếp chồng được gọi là các khối ảnh-thành phần.

4 Thuật ngữ viết tắt

Tiêu chuẩn này sử dụng các thuật ngữ viết tắt nêu trong Điều 4 của ISO/IEC 15444-1 và Điều 4 của ISO/IEC 15444-2.

5 Ký hiệu (và thuật ngữ viết tắt)

Tiêu chuẩn này sử dụng các ký hiệu nêu trong Điều 4 của ISO/IEC 15444-1 và Điều 5 của ISO/IEC 15444-2.

6 Mô tả chung

Tiêu chuẩn này đưa ra các phương pháp nén không tổn thất (bảo toàn các bit) và nén có tổn thất để mã hóa các ảnh màu số lập thể có sắc độ liên tục, hai mức, theo thang màu xám hoặc các ảnh lập thể đa thành phần. Các phương pháp này (xem Phụ lục A) mở rộng các phần tử trong hệ thống mã hóa lõi được mô tả trong ISO/IEC 15444-1 và ISO/IEC 15444-2. Các mở rộng liên quan đến việc mã hóa và giải mã được xác định là các thủ tục có thể được sử dụng kết hợp với các quá trình mã hóa và giải mã được mô tả trong ISO/IEC 15444-1 và ISO/IEC 15444-2. Mỗi mở rộng mã hóa và giải mã sẽ chỉ được sử dụng kết hợp với các quá trình mã hóa nhất định và chỉ tuân thủ các yêu cầu được đưa ra ở đây. Tiêu chuẩn này cũng đưa ra các mở rộng về định dạng dữ liệu nén, tức là định dạng trao đổi và các định dạng rút gọn.

Cụ thể là, tiêu chuẩn này hỗ trợ các mở rộng sau đối với ISO/IEC 15444-2:

1) độ lệch DC biến thiên;

2) các nhân biến đổi sóng con tùy ý;

3) các biến đổi đa thành phần;

4) các biến đổi phi tuyến;

5) vùng quan tâm.

Phụ lục A

(Quy định)

Cú pháp dòng mã, phần mở rộng

A.1 Khả năng mở rộng

Cú pháp trong phụ lục này hỗ trợ các mở rộng trong tiêu chuẩn này. Các đoạn nhãn tuân thủ các quy tác về cú pháp trong Phụ lục A của ISO/IEC 15444-1. Phần bổ sung của các giá trị tham số đối với một số đoạn nhãn trong ISO/IEC 15444-1 và ISO/IEC 15444-2, và phần bổ sung của các đoạn nhãn mới sẽ đưa ra thông tin cụ thể cho các mở rộng trong tiêu chuẩn này.

Trong mọi đoạn nhãn, hai byte đầu tiên ngay sau nhãn phải là một giá trị không báo hiệu biểu thị chiều dài của các tham số đoạn nhãn theo byte (bao gồm cả hai byte tham số chiều dài nhưng không gồm hai byte nhãn).

Nếu một đoạn nhãn hiện chưa được chỉ rõ trong tiêu chuẩn này hoặc trong ISO/IEC 15444-1 và ISO/IEC 15444-2 lại xuất hiện trong một dòng mã thì bộ giải mã phải sử dụng tham số chiều dài để loại bỏ đoạn nhãn này. Bảng A.1 đưa ra cách thức sử dụng đoạn nhãn trong tiêu chuẩn này.

Bảng A.1 – Danh sách nhãn và đoạn nhãn

	Ký hiệu	Mã	Tiêu đề chính	Tiêu đề khối ảnh-bộ phận	ISO/IEC 15444-x cũ/ mở rộng
Phân định các nhãn và đoạn nhãn
Bắt đầu dòng mã	SOC	0xFF4F	yêu cầu	không cho phép	ISO/IEC 15444-1:2004
Bắt đầu khối ảnh-bộ phận	SOT	0XFF90	không cho phép	yêu cầu	ISO/IEC 15444-2:2004
Bắt đầu dữ liệu	SOD	0xFF93	không cho phép	nhãn cuối cùng	ISO/IEC 15444-1:2004
Kết thúc dòng mã	EOC	0xFFD9	không cho phép	không cho phép	ISO/IEC 15444-1:2004
Các đoạn nhãn thông tin cố định
Kích thước ảnh và khối ảnh	SIZ	0xFF51	yêu cầu	không cho phép	ISO/IEC 15444-1:2004
Kích thước ảnh và khối ảnh chiều bổ sung	NSI	0xFF54	yêu cầu	không cho phép
Các khả năng mở rộng	CAP	0xFF50	yêu cầu	không cho phép	ISO/IEC 15444-2:2004/ Bổ sung.2:2006
Các đoạn nhãn chức năng
Mặc định kiểu mã hóa	COD	0xFF52	yêu cầu	tùy chọn	ISO/IEC 15444-1:2004, mở rộng
Thành phần kiểu mã hóa	COC	0xFF53	tùy chọn	tùy chọn	ISO/IEC 15444-1:2004, mở rộng
Vùng quan tâm	RGN	0xFF5E	tùy chọn	tùy chọn	ISO/IEC 15444-2:2004, mở rộng
Mặc định lượng tử hóa	QCD	0xFF5C	yêu cầu	tùy chọn	ISO/IEC 15444-1:2004, mở rộng
Thành phần lượng tử hóa	QCC	0xFF5D	tùy chọn	tùy chọn	ISO/IEC 15444-1:2004, mở rộng
Các nhân biến đổi tùy ý	ATK	0xFF79	tùy chọn	tùy chọn	ISO/IEC 15444-2:2004
Định nghĩa chiều sâu bit thành phần	CBD	0xFF78	tùy chọn	tùy chọn	ISO/IEC 15444-2:2004
Định nghĩa biến đổi đa thành phần	MCT	0xFF74	tùy chọn	tùy chọn	ISO/IEC 15444-2:2004
Tập hợp biến đổi đa thành phần	MCC	0xFF75	tùy chọn	tùy chọn	ISO/IEC 15444-2:2004
Thứ tự biến đổi đa thành phần	MCO	0xFF77	tùy chọn	tùy chọn	ISO/IEC 15444-2:2004
Biến đổi điểm phi tuyến	NLT	0xFF76	tùy chọn	tùy chọn	ISO/IEC 15444-2:2004
Độ lệch DC biến thiên	DCO	0xFF70	tùy chọn	tùy chọn	ISO/IEC 15444-2:2004
Các đoạn nhãn con trỏ
Các chiều dài khối ảnh-bộ phận	TLM	0xFF55	tùy chọn	không cho phép	ISO/IEC 15444-1:2004
Chiều dài gói tin, tiêu đề chính	PLM	0xFF57	tùy chọn	không cho phép	ISO/IEC 15444-1:2004
Chiều dài gói tin, tiêu đề khối ảnh-bộ phận	PLT	0xFF58	không cho phép	tùy chọn	ISO/IEC 15444-1:2004
Các tiêu đề gói tin đóng gói, tiêu đề chính	PPM	0xFF60	tùy chọn	không cho phép	ISO/IEC 15444-1:2004
Các tiêu đề gói tin đóng gói, tiêu đề khối ảnh-bộ phận	PPT	0xFF61	không cho phép	tùy chọn	ISO/IEC 15444-1:2004
Các nhãn và đoạn nhãn trong dòng bit
Bắt đầu gói tin	SOP	0xFF91	không cho phép	Không cho phép trong tiêu đề khối ảnh-bộ phận, tùy chọn trong dòng bit	ISO/IEC 15444-1:2004
Kết thúc tiêu đề gói tin	EPH	0xFF92	Tùy chọn trong đoạn nhãn PPM	Tùy chọn trong đoạn nhãn PPT hoặc trong dòng bit	ISO/IEC 15444-1:2004
Các đoạn nhãn cung cấp thêm thông tin
Đăng ký thành phần	CRG	0xFF63	tùy chọn	không cho phép	ISO/IEC 15444-1:2004, mở rộng
Chú giải	COM	0xFF64	tùy chọn	tùy chọn	ISO/IEC 15444-1:2004
a) “Yêu cầu” nghĩa là nhãn hoặc đoạn nhãn phải nằm trong tiêu đề này, “tùy chọn” nghĩa là có thể được sử dụng.

A.2 Các mở rộng đối với các tham số đoạn nhãn trong ISO/IEC 15444-1 và ISO/IEC 15444-2

A.2.1 Kích thước ảnh và khối ảnh chiều bổ sung (NSI)

Chức năng:	Cung cấp thông tin về ảnh chưa nén, ví dụ chiều sâu của lưới tọa độ tham chiếu, chiều sâu của các khối ảnh, và sự phân chia các mẫu thành phần theo lưới tọa độ tham chiếu.
Cách sử dụng:	Tiêu đề chính. Phải có một và chỉ một NSI trong tiêu đề chính.
Chiều dài:	Biến thiên tùy theo số lượng thành phần.

Hình A.1 – Cú pháp kích thước ảnh và khối ảnh chiều bổ sung (mở rộng)

NSI:	Mã nhãn. Bảng A.2 đưa ra các giá trị kích thước và tham số của ký hiệu và các tham số đối với đoạn nhãn kích thước ảnh và khối ảnh chiều bổ sung.
Lnsi:	Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bằng công thức sau: Lnsi = 19 + Csiz (A-1)
Ndim:	Xác định tính chất chiều của tập dữ liệu (không xét đến chiều của thành phần). Giá trị này được đặt mặc định là 3.
Zsiz:	Chiều sâu của lưới tọa độ tham chiếu.
ZOsiz:	Độ lệch chiều sâu từ gốc lưới tọa độ tham chiếu đến góc trước bên trái phía trên của khối ảnh.
ZTsiz:	Chiều sâu của khối ảnh tham chiếu so với lưới tọa độ tham chiếu.
ZTOsiz:	Độ lệch dọc từ gốc lưới tọa độ tham chiếu đến góc trước bên trái phía trên của khối ảnh đầu tiên.
ZRsizi:	Phân chia chiều sâu của một mẫu của thành phần thứ i so với lưới tọa độ tham chiếu. Tham số này xuất hiện một lần đối với mỗi thành phần, và chúng xuất hiện theo thứ tự thành phần.

Bảng A.2 – Các giá trị tham số kích thước ảnh và khối ảnh chiều bổ sung (mở rộng)

Tham số	Kích thước (bit)	Giá trị
NSI	16	0xFF54
Lnsi	16	20-16403
Ndim	8	3
Zsiz	32	1 -(2³² – 1)
ZOsiz	32	0-(2³² – 1)
ZTsiz	32	1-(2³² – 1)
ZTOsiz	32	1-(2³² – 2)
ZRsizⁱ	8	1-255

A.2.2 Mặc định kiều mã hóa (COD), mở rộng của ISO/IEC 15444-1

Chức năng:

Mô tả kiểu mã hóa, số lượng mức phân tách và việc phân lớp mặc định được sử dụng để nén mọi thành phần của ảnh (nếu nằm trong tiêu đề chính) hoặc khối ảnh (nếu nằm trong tiêu đề khối ảnh-bộ phận). Đối với mỗi thành phần riêng lẻ, các giá trị tham số này có thể bị ghi đè bởi một đoạn nhãn COC trong tiêu đề chính hoặc tiêu đề khối ảnh-bộ phận.

Cách sử dụng:

Tiêu đề chính và tiêu đề khối ảnh-bộ phận đầu tiên của mỗi khối ảnh nhất định. Chỉ có một và chỉ một COD trong tiêu đề chính. Hơn nữa, mỗi khối ảnh có thể chỉ có tối đa một COD. Nếu khối ảnh có nhiều khối ảnh-bộ phận, và có đoạn nhãn này thì COD chỉ có thể có trong khối ảnh-bộ phận đầu tiên (TPsot = 0).

Khi được sử dụng trong tiêu đề chính, các giá trị tham số đoạn nhãn COD được sử dụng cho mọi khối ảnh-thành phần không có đoạn nhãn COC tương ứng trong tiêu đề chính hoặc tiêu đề khối ảnh-bộ phận. Khi được sử dụng trong tiêu đề khối ảnh-bộ phận, giá trị tham số này ghi đè lên COD và các COC của tiêu đề chính và được sử dụng cho mọi thành phần trong khối ảnh đó mà không cần một đoạn nhãn COC tương ứng trong khối ảnh-bộ phận. Do vậy, thứ tự ưu tiên như sau:

COC khối ảnh-bộ phận > COD khối ảnh-bộ phận > COC chính > COD chính

với ký hiệu “lớn hơn”, >, có nghĩa là đoạn nhãn lớn hơn ghi đè lên nhãn bé hơn.

Chiều dài:

Biến thiên tùy theo giá trị của Scod (xem tham số Lcod).

Hình A.2 – Cú pháp mặc định kiểu mã hóa

COD:	Mã nhãn. Bảng A.3 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn mặc định kiểu mã hóa.
Lcod:	Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bằng công thức sau:
		maximum_precincts	(A-2)
		user_defined_precints
	với maximum_precincts và user_defined_precincts được cho trong tham số Scod và number_of_resolution_levels được tính toán bằng cách sử dụng số lượng tham số mức phân tách đối với từng chiều trong ba chiều, X, Y và Z, như được cho trong tham số SPcod. Công thức thực tế để tính toán số lượng mức phân giải được cho trong B.5.
Scod:	Kiểu mã hóa đối với mọi thành phần. Bảng A.4 đưa ra giá trị đối với tham số Scod.
SGcod:	Các tham số đối với kiểu mã hóa được chỉ định trong Scod. Các tham số là độc lập với các thành phần và được định rõ theo thứ tự từ cao xuống thấp như trong Bảng A.5. Các tham số kiểu mã hóa thuộc trường SGcod xuất hiện theo dãy như trong Hình A.3.
SPcod:	Các tham số đối với kiểu mã hóa được chỉ rõ trong Scod. Các tham số này liên quan đến mọi thành phần và được chỉ định theo thứ tự từ cao xuống thấp như trong Bảng A.6. Các tham số kiểu mã hóa trong trường SPcod xuất hiện theo dãy như trong Hình A.3.

Bảng A.3 – Các giá trị tham số mặc định kiểu mã hóa, phần mở rộng

Tham số	Kích thước (bit)	Giá trị
COD	16	0xFF52
Lcod	16	17-83
Scod	8	Bảng A.4
SGcod	32	Bảng A.5
SPcod	Biến thiên	Bảng A.6

	A	Thứ tự lũy tiến
	B	Số lớp
	C	Biến đổi đa thành phần
	D	Số mức phân tách dọc trục X
	E	Số mức phân tách dọc trục Y
	F	Số mức phân tách dọc trục Z
	G	Chiều rộng khối mã
	H	Chiều cao khối mã
	I	Chiều sâu khối mã
	J	Kiểu khối mã
	K	Nhân biến đổi dọc trục X
	L	Nhân biến đổi dọc trục Y
	M	Nhân biến đổi dọc trục Z
	Nⁱ – Nⁿ	Các kích thước phân khu

Hình A.3 – Sơ đồ tham số kiểu mã hóa của các tham số SGcod và SPcod

Bảng A.4 – Các giá trị tham số kiểu mã hóa đối với tham số Scod

Giá trị (bit) MSB LSB	Kiểu mã hóa
xxxx xxx0	Bộ mã hóa và giải mã entropy, các phân khu có PPx = 15, PPy = 15 and PPz = 15
xxxx xxx1	Bộ mã hóa và giải mã entropy với các phân khu thông lệ như định nghĩa ở dưới
xxxx xx0x	Không có đoạn nhãn SOP nào được sử dụng
xxxx xx1x	Các đoạn nhãn SOP có thể được sử dụng
xxxx x0xx	Không có nhãn EPH nào được sử dụng
xxxx x1xx	Nhãn EPH có thể được sử dụng
	Tất cả các giá trị khác dùng cho dự phòng

Bảng A.5 – Các giá trị tham số kiểu mã hóa đối với tham số Gcod

Tham số (theo thứ tự)	Kích thước (bit)	Giá trị	Ý nghĩa của các giá trị SGcod
Thứ tự lũy tiến	8	Bảng A.16 của ISO/IEC 15444-1	Thứ tự lũy tiến
Số lượng lớp	16	1-65535	Số lượng các lớp
Biến đổi đa thành phần	8	Bảng A.8 của ISO/IEC 15444-2	Cách sử dụng biến đổi đa thành phần

Bảng A.6 – Các giá trị tham số kiểu mã hóa của các tham số SPcod và SPcoc, phần mở rộng

Tham số (theo thứ tự)	Kích thước (bit)	Giá trị	Ý nghĩa của các giá trị SPcod
Số lượng mức phân tách dọc trục X	8	0-32	Số lượng mức phân tách dọc trục X, N_LX, 0 nghĩa là không có biến đổi
Số lượng mức phân tách dọc trục Y	8	0-32	Số lượng mức phân tách dọc trục Y, N_LY, 0 nghĩa là không có biến đổi
Số lượng mức phân tách dọc trục z	8	0-32	Số lượng mức phân tách dọc trục Z, N_LZ, 0 nghĩa là không có biến đổi
Chiều rộng khối mã 3D	8	Bảng A.7	Giá trị độ lệch theo hàm mũ của chiều rộng khối mã, xcb
Chiều dài khối mã 3D	8	Bảng A.7	Giá trị độ lệch theo hàm mũ của chiều dài khối mã, ycb
Chiều sâu khối mã 3D	8	Bảng A.7	Giá trị độ lệch theo hàm mũ của chiều sâu khối mã, zcb
Kiểu của khối mã 3D	8	Bảng A.8	Kiểu của các quá trình mã hóa của khối mã 3D
Nhân biến đổi dọc trục X	8	Bảng A.10 của ISO/IEC 15444-2	Biến đổi sóng con được sử dụng dọc trục X
Nhân biến đổi dọc trục Y	8	Bảng A.10 của ISO/IEC 15444-2	Biến đổi sóng con được sử dụng dọc trục Y
Nhân biến đổi dọc trục Z	8	Bảng A.10 của ISO/IEC 15444-2	Biến đổi sóng con được sử dụng dọc trục Z
Kích thước phân khu	Biến thiên	Bảng A.9	Nếu Scod hoặc Scoc = xxxx xxx0 thì không có tham số này; ngược lại thì tham số này chỉ ra chiều rộng, chiều dài và chiều sâu phân khu. Tham số đầu tiên (16 bit) tương ứng với băng con N_LLLL. Mỗi tham số liên tiếp tương ứng với mỗi mức phân giải liên tiếp theo thứ tự.

Bảng A.7 – Số mũ chiều rộng, chiều cao hoặc chiều sâu của các khối mã 3D đối với các tham số SPcod và SPcoc

Giá trị (bit)
MSB LSB

Chiều rộng, chiều cao và chiều sâu của khối mã 3D

xxxx 0000 – xxxx 1011

Các giá trị số mũ chiều rộng, chiều cao và chiều sâu của khối mã 3D xcb = giá trị, ycb = giá trị hoặc zcb = giá trị.

CHÚ THÍCH: Phần này định nghĩa lại ISO/IEC 15444-1. Chiều rộng, chiều cao và chiều sâu của khối mã 3D bị giới hạn ở các lũy thừa của 2 với kích thước nhỏ nhất là 2⁰ và lớn nhất là 2¹⁰.

Hơn nữa, kích thước khối mã 3D bị giới hạn sao cho 4 ≤ xcb+ycb+zcb ≤ 18.

Tất cả các giá trị khác dùng cho dự phòng

Bảng A.8 – Kiểu khối mã 3D đối với các tham số SPcod và SPcoc, mở rộng

Giá trị (bit) MSB LSB	Kiểu khối mã 3D
xxxx xxx0	Không lựa chọn bỏ qua mã hóa số học
xxxx xxx1	Lựa chọn bỏ qua mã hóa số học
xxxx xx0x	Không đặt lại các xác suất ngữ cảnh trên các biên thẻ mã hóa
xxxx xx1x	Đặt lại các xác suất ngữ cảnh trên các biên quá trình mã hóa
xxxx x0xx	Không kết thúc trên mỗi quá trình mã hóa
xxxx x1xx	Kết thúc trên mỗi quá trình mã hóa
xxxx 0xxx	Không có ngữ cảnh nhân quả
xxxx 1xxx	Các ngữ cảnh nhân quả
xxx0 xxxx	Không kết thúc đoán trước
xxx1 xxxx	Kết thúc đoán trước
xx0x xxxx	Không có ký hiệu phân đoạn nào được sử dụng
xx1x xxxx	Các ký hiệu phân đoạn được sử dụng
	Tất cả các giá trị khác dùng cho dự phòng

Bảng A.9 – Chiều rộng, chiều dài và chiều sâu phân khu đối với các tham số SPcod và Spcoc, phần mở rộng

Giá trị (bit) MSB LSB	Kích thước phân khu
xxxx xxxx xxxx 0000 – xxxx xxxx xxxx 1111	4 LSB là số mũ chiều rộng phân khu PPx = giá trị. Giá trị này có thể chỉ bằng 0 tại mức phân giải tương ứng với băng N_LLLL
xxxx xxxx 0000 xxxx – xxxx xxxx 1111 xxxx	4 bit tiếp theo là số mũ chiều dài phân khu PPy = giá trị. Giá trị này có thể chỉ bằng 0 tại mức phân giải tương ứng với băng N_LLLL
xxxx 0000 xxxx xxxx – xxxx 1111 xxxx xxxx	4 bit tiếp theo là số mũ chiều sâu phân khu PPz = value. Giá trị này có thể chỉ bằng 0 tại mức phân giải tương ứng với băng N_LLLL.
	Tất cả các giá trị khác dùng cho dự phòng.

A.2.3 Thành phần kiểu mã hóa (COC), mở rộng của ISO/IEC 15444-1

Chức năng:

Mô tả kiểu mã hóa và số lượng mức phân tách được sử dụng để nén một thành phần nhất định.

Cách sử dụng:

Tiêu đề chính và tiêu đề khối ảnh bộ phận đầu tiên của một khối ảnh nào đó. Cách sử dụng là tùy chọn ở cả các tiêu đề chính và khối ảnh-bộ phận. Trong cả các tiêu đề chính hoặc khối ảnh-bộ phận, mỗi thành phần nhất định chỉ có thể có tối đa một COC. Nếu có nhiều khối ảnh-bộ phận trong một khối ảnh và có đoạn nhãn này thì COC chỉ có thể có trong khối ảnh-bộ phận đầu tiên (TPsot = 0).

Đối với mỗi thành phần, khi được sử dụng trong tiêu đề chính thì COC ghi đè lên đoạn nhãn COD chính. Đối với mỗi thành phần, khi được sử dụng trong tiêu đề khối ảnh-bộ phận thì COC ghi đè lên COD tiêu đề chính, COC chính và COD khối ảnh. Do đó, thứ tự ưu tiên như sau:

COC khối ảnh-bộ phận > COD khối ảnh-bộ phận > COC chính > COD chính

Với dấu “lớn hơn”, >, có nghĩa là đoạn nhãn lớn hơn ghi đè lên đoạn nhãn bé hơn.

Chiều dài:

Biến thiên tùy theo giá trị của Scoc (xem tham số Lcoc).

Hình A.4 – Cú pháp thành phần kiểu mã hóa

COC:	Mã nhãn. Bảng A.10 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn thành phần kiều mã hóa.
Lcoc:	Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bằng công thức sau:
		maximum_precincts AND Csiz < 257	(A-3)
		maximum_precincts AND Csiz ≥ 257
		user_defined_precincts AND Csiz < 257
		user_defined_precincts AND Csiz ≥ 257
Ccoc:	Chỉ số của thành phần mà đoạn nhãn này liên quan. Các thành phần có chỉ số 0, 1, 2, …
Scoc:	Kiểu mã hóa đối với thành phần này. Bảng A.11 đưa ra các giá trị đối với mỗi tham số Scoc.
SPcoc:	Các tham số đối với kiểu mã hóa được xác định trong Scoc. Các tham số kiểu mã hóa trong trường SPcoc xuất hiện theo dãy thứ tự như trong Hình A.5.

Kⁱ

Kⁿ

A	Số lượng mức phân tách dọc trục X
B	Số lượng mức phân tách dọc trục Y
C	Số lượng mức phân tách dọc trục Z
D	Chiều rộng khối mã
E	Chiều cao khối mã
F	Chiều sâu khối mã
G	Kiểu khối mã
H	Nhân biến đổi dọc trục X
I	Nhân biến đổi dọc trục Y
J	Nhân biến đổi dọc trục Z
Kⁱ – Kⁿ	Các kích thước phân khu

Hình A.5 – Sơ đồ tham số kiểu mã hóa của tham số SPcoc

Bảng A.10 – Các giá trị tham số thành phần kiểu mã hóa, phần mở rộng

Tham số	Kích thước (bit)	Giá trị
COC	16	0xFF53
Lcoc	16	4-102
Ccoc	8 16	0-255; nếu Csiz < 257 0-16383; nếu Csiz ≥ 257
Scoc	8	Bảng A.11
SPcoci	Biến thiên	Bảng A.6

Bảng A.11 – Các giá trị tham số kiểu mã hóa đối với tham số Scoc, phần mở rộng

Giá trị (bit) MSB LSB	Kiểu mã hóa
xxxx xxx0	Bộ mã hóa và giải mã Entropy với các giá trị phân khu lớn nhất PPx = PPy = PPz =15
xxxx xxx1	Bộ mã hóa và giải mã Entropy có các giá trị phân khu được xác định trong SPcoc
	Tất cả các giá trị khác dùng cho dự phòng

A.2.4 Vùng quan tâm (RGN), mở rộng của ISO/IEC 15444-2

Chức năng:

Báo hiệu về sự có mặt của vùng quan tâm (ROI) trong dòng mã.

Cách sử dụng:

Tiêu đề chính và tiêu đề khối ảnh-bộ phận đầu tiên của khối ảnh cụ thể. Nếu có đoạn nhãn RGN trong tiêu đề chính với Srgn = 0 thì không được có bất kỳ một đoạn nhãn RGN nào trong dòng mã với giá trị Srgn khác 0 đối với thành phần được cho bởi giá trị Crgn tương ứng. Ngược lại, nếu có đoạn nhãn RGN trong tiêu đề chính với giá trị Srgn khác 0 thì không được có bất kỳ một đoạn nhãn RGN nào trong dòng mã với Srgn = 0 đối với thành phần được cho bởi giá trị Crgn tương ứng.

Đối với mỗi khối ảnh, khi được sử dụng trong cả tiêu đề chính và tiêu đề khối ảnh-bộ phận đầu tiên thì RGN trong tiêu đề khối ảnh-bộ phận đầu tiên ghi đè lên RGN chính. Và, RGN xác định một thành phần đơn (Crgn ≠ 65 535) cũng ghi đè lên RGN xác định mọi thành phần (Crgn = 65 535). Do đó, thứ tự ưu tiên như sau:

RGN khối ảnh-bộ phận (Crgn ≠ 65 535) > RGN khối ảnh-bộ phận (Crgn = 65 535) > RGN chính (Crgn ≠ 65 535) > RGN chính (Crgn = 65 535)

Với dấu “lớn hơn”, >, có nghĩa là đoạn nhãn lớn hơn ghi đè lên đoạn nhãn bé hơn.

Chiều dài:

Biến thiên

Hình A.6 – Cú pháp vùng quan tâm

RGN:	Mã nhãn. Bảng A.12 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn vùng quan tâm.
Lrgn:	Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn).
Crgn:	Chỉ số của thành phần mà nhãn này liên quan. Các thành phần có chỉ số 0, 1, 2,…
Srgn:	Kiểu ROI đối với ROI hiện tại. Bảng A.16 của ISO/IEC 15444-2 đưa ra giá trị đối với tham số Srgn.
SPrgn:	Tham số đối với kiểu ROI được chỉ định trong Srgn. SPrgn chỉ được báo hiệu đối với Srgn = 1 hoặc Srgn = 2.

Bảng A.12 – Các giá trị tham số vùng quan tâm, phần mở rộng

Tham số	Kích thước (bit)	Giá trị
RGN	16	0xFF5E
Lrgn	16	5-30
Crgn	16	Bảng A.17 của ISO/IEC 15444-2
Srgn	8	Bảng A.16 của ISO/IEC 15444-2
SPrgn	Biến thiên	Bảng A.13

Bảng A.13 – Các gíá trị vùng quan tâm từ tham số SPrgn (Srgn = 1 hoặc Srgn = 2), phần mở rộng

Tham số (theo thứ tự)	Kích thước (bit)	Giá trị	Ý nghĩa của giá trị SPrgn
Dịch nhị phân	8	0-255	Dịch nhị phân của các hệ số trong vùng quan tâm trên hình nền.
XArgn (bên trái)	32	0-(2³²-1)	Điểm lưới tọa độ tham chiếu ngang từ gốc của điểm đầu tiên. (Trong trường hợp ellipse, Srgn = 2, giá trị này không được lớn hơn chiều rộng của ảnh.)
YArgn (ở trên)	32	0-(2³²-1)	Điểm lưới tọa độ tham chiếu dọc từ gốc của điểm đầu tiên. (Trong trường hợp ellipse, Srgn = 2, giá trị này không được lớn hơn chiều cao của ảnh.)
ZArgn (mặt trước)	32	0-(2³² -1)	Điểm lưới tọa độ tham chiếu trục từ gốc của điểm đầu tiên. (Trong trường hợp ellipse, Srgn = 2, giá trị này không được lớn hơn chiều sâu của ảnh.)
XBrgn (bên phải)	32	0-(2³²-1)	Điểm lưới tọa độ tham chiếu ngang từ gốc của điểm thứ hai.
YBrgn (ở dưới)	32	0-(2³²– 1)	Điểm lưới tọa độ tham chiếu dọc từ gốc của điểm thứ hai.
ZBrgn (mặt sau)	32	0-(2³² -1)	Điểm lưới tọa độ tham chiếu trục từ gốc của điểm thứ hai.

A.2.5 Mặc định thành phần lượng tử hóa (QCD), mở rộng của ISO/IEC 15444-1

Chức năng:

Mô tả mặc định lượng tử hóa được sử dụng để nén tất cả các thành phần chưa được xác định bởi một đoạn nhãn QCC. Đối với mỗi thành phần riêng lẻ, các giá trị tham số này có thể bị ghi đè bởi một đoạn nhãn QCC trong tiêu đề chính hoặc tiêu đề khối ảnh-bộ phận.

Usage:

Tiêu đề chính và tiêu đề khối ảnh-bộ phận đầu tiên của một khối ảnh cụ thể. Chỉ có một và chỉ một QCD trong tiêu đề chính. Có thể có tối đa một QCD đối với mọi tiêu đề khối ảnh-bộ phận của mỗi khối ảnh. Nếu khối ảnh có nhiều khối ảnh-bộ phận, và có đoạn nhãn này thì QCD chỉ nằm trong khối ảnh-bộ phận đầu tiên (TPsot = 0).

Đối với thành phần nhất định, khi được sử dụng trong tiêu đề khối ảnh-bộ phận thì QCD đó ghi đè lên QCD chính và QCC chính. Do đó, thứ tự ưu tiên như sau:

QCC khối ảnh-bộ phận > QCD khối ảnh-bộ phận > QCC chính > QCD chính

Với dấu “lớn hơn”, >, có nghĩa là đoạn nhãn lớn hơn ghi đè lên đoạn nhãn bé hơn.

Chiều dài:

biến thiên tùy theo số lượng phần tử được lượng tử hóa.

Hình A.7 – Kiểu mặc định lượng tử hóa

QCD:	Mã nhãn. Bảng A.14 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn mặc định lượng tử hóa.
Lqcd:	Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bằng công thức sau:
		no_quantization	(A-4)
		scalar_quantization_derived
		scalar_quantization_expounded
	với number_of_sub-bands (phụ thuộc vào số lượng mức phân tách dọc trục X, Y và Z axis) được xác định trong các đoạn nhãn COD và COC, và no_quantization, scalar_quantization_derived, hoặc scalar_quantization_expounded được báo hiệu trong tham số Sqcd. CHÚ THÍCH: Lqcd có thể được sử dụng để xác định xem trong đoạn nhãn có bao nhiêu kích thước bước lượng tử hóa. Tuy nhiên, không nhất thiết là số kích thước bước lượng tử hóa phải tương đương với số băng con hiện có do các băng con có thể bị bỏ bớt mà không cần phải sửa đoạn nhãn này.
Sqcd:	Kiểu lượng tử hóa đối với mọi thành phần
SPqcdi:	Giá trị kích thước bước lượng tử hóa đối với băng con thứ i theo một thứ tự xác định (xem Phụ lục B). Số lượng tham số bằng số lượng băng con trong khối ảnh- thành phần có số lượng mức phân tách lớn nhất, NL.

Bảng A-14 – Các giá trị tham số mặc định lượng tử hóa, phần mở rộng

Tham số	Kích thước (bit)	Giá trị
QCD	16	0xFF5C
Lqcd	16	4-441
Sqcd	8	Bảng A.28 của ISO/IEC 15444-1
SPqcdⁱ	Biến thiên	Bảng A.28 của ISO/IEC 15444-1

A.2.6 Thành phần lượng tử hóa (QCC), mở rộng của ISO/IEC 15444-1

Chức năng:

Mô tả sự lượng tử hóa được sử dụng để nén một thành phần nhất định.

Cách sử dụng:

Tiêu đề chính và tiêu đề khối ảnh-bộ phận đầu tiên của một khối ảnh nhất định. Cách sử dụng là tùy chọn ở cả các tiêu đề chính và tiêu đề khối ảnh-bộ phận. Với mỗi thành phần nhất định, không có hơn một QCC trong các tiêu đề chính và tiêu đề khối ảnh-bộ phận. Nếu một khối ảnh có nhiều khối ảnh-bộ phận, và có đoạn nhãn này thì QCC chỉ có thể có trong khối ảnh-bộ phận đầu tiên (TPsot = 0).

Tùy chọn trong cả các tiêu đề chính và tiêu đề khối ảnh-bộ phận. Đối với mỗi thành phần nhất định, khi được sử dụng trong tiêu đề chính thì QCC ghi đè lên đoạn nhãn QCD chính. Đối với mỗi thành phần nhất định, khi được sử dụng trong tiêu đề khối ảnh-bộ phận thì QCC ghi đè lên QCD chính, QCC chính, và QCD của khối ảnh. Do đó, thứ tự ưu tiên như sau:

QCC khối ảnh-bộ phận > QCD khối ảnh-bộ phận > QCC chính > QCD chính

Với dấu “lớn hơn”, >, có nghĩa là đoạn lớn hơn ghi đè lên đoạn bé hơn.

Chiều dài

biến thiên tùy theo số lượng phần tử được lượng tử.

Hình A.8 – Cú pháp của thành phần lượng tử hóa

QCD:	Mã nhãn. Bản A.15 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn thành phần lượng tử hóa.
Lqcc:	Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bằng công thức sau:
		no_quantization AND Csiz < 257	(A-5)
		scalar_quantization_derived AND Csiz < 257
		scalar_quantization_expounded AND Csiz < 257
		no_quantization AND Csiz ≥ 257
		scalar_quantization_derived AND Csiz ≥ 257
		scalar_quantization_expounded AND Csiz ≥ 257
	CHÚ THÍCH: Lqcc có thể được sử dụng để xác định xem có bao nhiêu kích thước bước lượng tử trong đoạn nhãn. Tuy nhiên, không nhất thiết là số lượng kích thước bước lượng tử hóa phải tương đương với số lượng băng con hiện có do các băng con có thể bị bỏ bớt mà không cần phải sửa đoạn nhãn này.
Cqcc:	Chỉ số của thành phần mà đoạn nhãn này liên quan. Các thành phần có chỉ số 0, 1, 2, … (8 hoặc 16 bit tùy theo kích thước Csiz.)
Sqcc:	Kiểu lượng tử hóa đối với thành phần này.
SPqcci:	Giá trị lượng tử hóa đối với mỗi băng con theo một thứ tự xác định (xem Phụ lục D). Số lượng tham số bằng số lượng băng con trong khối ảnh-thành phần có số lượng mức phân tách lớn nhất.

Bảng A.15 – Các giá trị tham số thành phần lượng tử hóa

Tham số	Kích thước (bit)	Giá trị
QCC	16	0xFF5D
Lqcc	16	5-443
Cqcc	8	0-255; nếu Csiz < 257
	16	0-16383; nếu Csiz ≥ 257
Sqcc	8	Bảng A.28 của ISO/IEC 15444-1
SPqccⁱ	Biến thiên	Bảng A.28 của ISO/IEC 15444-1

A.2.7 Đăng ký thành phần (CRG), mở rộng của ISO/IEC 15444-1

Chức năng:

Cho phép sự đăng ký riêng của các thành phần theo các thành phần khác. Với các mục đích mã hóa, các mẫu của các thành phần được coi là nằm tại các điểm lưới tọa độ tham chiếu là bội số nguyên của XRsiz, YRsiz và ZRsiz (xem Phụ lục B). Tuy nhiên, điều này có thể không phù hợp cho việc kết xuất ảnh. Đoạn nhãn CRG mô tả “trọng tâm” của các mẫu của từng thành phần theo sự phân chia. Đoạn nhãn này không có ảnh hưởng đến việc giải mã dòng mã.

CHÚ THÍCH: Độ lệch đăng ký thành phần này là theo độ lệch ảnh (XOsiz, YOsiz và ZOsiz) và sự phân chia thành phần (XRsizⁱ, YRsizⁱ and ZRsizⁱ). Ví dụ, điểm lưới tọa độ tham chiếu ngang đối với các mẫu bên trái gần nhất của thành phần c là XRsiz^c.[XOsiz / XRsiz^c] (Ngược lại đối với chiều dọc và chiều trục.) Độ lệch ngang được chỉ thị trong đoạn nhãn này là phần bổ sung vào độ lệch này.

Cách sử dụng:

Chỉ trong tiêu đề chính. Chỉ một CRG có thể được sử dụng trong tiêu đề chính và điều này có thể áp dụng cho tất cả các khối ảnh.

Chiều dài:

Biến thiên tùy theo số thành phần.

CRG

Lcrg

Xcrgⁱ

Ycrgⁱ

Zcrgⁱ

Xcrgⁿ

Ycrgⁿ

Zcrgⁿ

Hình A.9 – Cú pháp đăng ký thành phần

CRG:	Mã nhãn. Bảng A.16 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn đăng ký thành phần.
Lcrg:	Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn).
Xcrgi:	Giá trị của độ lệch ngang, theo đơn vị là 1/65536 của phân chia ngang XRsizⁱ, đối với thành phần thứ i. Do đó, dải giá trị từ 0/65536 (mẫu tại điểm lưới tọa độ tham chiếu của mẫu) đến XRsiz^c (65535/65536) (ngay trước điểm lưới tọa độ tham chiếu của mẫu tiếp theo). Giá trị này được lặp lại đối với mọi thành phần.
Ycrgi:	Giá trị của độ lệch dọc, theo đơn vị là 1/65536 của sự phân chia dọc YRsizⁱ đối với thành phần thứ i. Do đó, dải giá trị từ 0/65536 (mẫu tại điểm lưới tọa độ tham chiếu của mẫu) đến YRsiz^c (65535/65536) (ngay trước điểm lưới tọa độ tham chiếu của mẫu tiếp theo). Giá trị này được lặp lại đối với mọi thành phần.
Zcrgi:	Giá trị của độ lệch trục, theo đơn vị là 1/65536 của sự phân chia trục ZRsizⁱ, đối với thành phần thứ i. Do đó, dải giá trị từ 0/65536 (mẫu tại điểm lưới tọa độ tham chiếu của mẫu) đến ZRsiz^c (65535/65536) (ngay trước điểm lưới tọa độ tham chiếu của mẫu tiếp theo). Giá trị này được lặp lại đối với mọi thành phần.

Bảng A.16 – Các giá trị tham số đăng ký thành phần

Tham số	Kích thước (bit)	Giá trị
CRG	16	0xFF63
Lcrg	16	6-65534
Xcrgⁱ	16	0-65535
Ycrgⁱ	16	0-65535
Zcrgⁱ	16	0-65535

A.2.8 Khả năng mở rộng (CAP), ISO/IEC 15444-2:2004/Adm. 2:2006

Tiêu chuẩn này yêu cầu phải có đoạn nhãn CAP trong tiêu đề chính, với trường Pcap báo hiệu việc sử dụng ISO/IEC 15444-10 như được mô tả trong ISO/IEC 15444-2. Bảng A.17 giải thích cách sử dụng tham số Ccapⁱ trong tiêu chuẩn này.

CHÚ THÍCH: Các khả năng mở rộng này được phát triển sau phiên bản đầu tiên của ISO/IEC 15444-2, và được chi rõ trong bản sửa đổi của ISO/IEC 15444-2:2004/Amd.2:2006.

Tiêu chuẩn này yêu cầu trường Rsiz của đoạn nhãn SIZ (xem ISO/IEC 15444-2) phải báo hiệu sự có mặt của đoạn nhãn CAP bằng cách cho phép có bit có trọng số cao thứ hai. Điều này sẽ khiến các bộ giải mã không thể xử lý chính xác các dòng mã cho phép của ISO/IEC 15444-10 một cách liên tục. Do vậy, đoạn nhãn CAP nên xuất hiện ngay sau đoạn nhãn SIZ, sao cho bộ giải mã có thể dễ dàng nhận ra các dòng mã cho phép của ISO/IEC 15444-10 trước khi gặp các đoạn nhãn mở rộng bất kỳ.

Bảng A.17 – Ccapi, phần mở rộng

Giá trị (bit) MSB LSB	Kiểu mã hóa
0000 0000 0000 0000 0000	Không có các khả năng mở rộng
	Tất cả các giá trị khác dùng cho dự phòng

Phụ lục B

(Quy định)

Ảnh và xếp thứ tự dữ liệu ảnh nén, phần mở rộng

B.1 Giới thiệu

Trong phụ lục này và các điều nhỏ của phụ lục, các biểu đồ và bảng chỉ có tính quy định trong trường hợp chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này mô tả các thực thể cấu trúc khác nhau và tổ chức của chúng trong dòng mã: các thành phần, các khối ảnh, các băng con và các phần nhỏ của chúng.

Phụ lục này là phần mở rộng Phụ lục B cửa ISO/IEC 15444-1 thêm tính năng mã hóa khối, tức là, từ hai thành ba chiều không gian. Các phần sau đây sẽ chỉ mô tả những phần thay đổi so với Phụ lục B của ISO/IEC 15444-1 thêm chiều trục bổ sung. Trừ khi được ghi chú rõ thì mọi mô tả và các đặc tả của ISO/IEC 15444-1 vẫn được áp dụng.

B.2 Giới thiệu các khái niệm về cấu trúc dữ liệu ảnh

Đây là nội dung cập nhật B.1 của ISO/IEC 15444-1.

Các thành phần không còn chứa các mảng hai chiều của các mẫu, nhưng chúng lại gồm các mảng ba chiều của các mẫu. Mỗi thành phần, c, bây giờ có các tham số XRsiz^c, YRsiz^c và ZRsiz^c xác định sự ánh xạ giữa các mẫu thành phần và các điểm lưới tọa độ tham chiếu.

Mỗi mức phân giải đều gồm các băng con [L|H|X][L|H|X][L|H|X] (không bao gồm băng con LLL) hoặc băng con N_LLLL, do đó làm thay đổi số lượng băng con trên mỗi mức phân tách,m, với m < N_L, từ ba thành dải [2;7] (xem Hình D.6).

Mỗi băng con đều có gốc. Các điều kiện biên của băng con là riêng cho mỗi băng con [L|H|X][L|H|X][L|H|X].

B.3 Ánh xạ thành phần vào lưới tọa độ tham chiếu

Đây là nội dung cập nhật B.2 của ISO/IEC 15444-1.

Lưới tọa độ tham chiếu trở thành không gian ba chiều của các điểm có chỉ số từ (0, 0, 0) tới (Xsiz-1, Ysiz-1, Zsiz-1). Khi đó, mỗi “vùng ảnh” được xác định trên lưới tọa độ tham chiếu bằng các tham số chiều, (Xsiz, Ysiz, Zsiz) và (XOsiz, YOsiz, ZOsiz). Cụ thể là, vùng ảnh trên lưới tọa độ tham chiếu được xác định bởi các điểm lưới tọa độ tham chiếu của chúng tại vị trí (XOsiz, YOsiz, ZOsiz) và (Xsiz-1, Ysiz-1, Zsiz-1).

Các mẫu của thành phần c bây giờ nằm tại các vị trí bội số nguyên của (XRsiz^c, YRsiz^c, ZRsiz^c) trên lưới tọa độ tham chiếu. Mỗi vùng thành phần là một phiên bản mẫu con của lưới tọa độ tham chiếu có tọa độ (0, 0, 0) là điểm chung của từng thành phần.

Do đó, các mẫu của thành phần c được ánh xạ vào một hình khối có các tọa độ góc (x₀, y₀, z₀) và (X₁– 1, y₁-1, z₁ -1), với x₀, y₀, x₁ và y₁ được xác định bởi công thức B-1 của ISO/IEC 15444-1 và z₀ và z₁ xác định như sau:

(B-1)

Do đó, ba chiều của thành phần c được xác định bởi

(chiều rộng, chiều cao, chiều sâu) = (x₁ – x₀, y₁ – y₀, z₁ – z₀) (B-2)

Các tham số Zsiz, ZOsiz và ZRsiz^c đều được xác định trong đoạn nhãn NSI (xem A.2.1).

B.4 Phân chia vùng ảnh thành các khối ảnh và các khối ảnh-thành phần

Đây là nội dung cập nhật B.3 của ISO/IEC 15444-1.

Lưới tọa độ tham chiếu được phân chia thành một mảng ba chiều kích thước thông thường của các khối ảnh. Trên lưới tọa độ tham chiếu, kích thước khối ảnh và các độ lệch phân chia khối ảnh được xác định tương ứng bởi các cặp chiều (XTsiz, YTsiz, ZTsiz) và (XTOsiz, YTOsiz, ZTOsiz). ZTsiz và ZTOsiz là các tham số từ đoạn nhãn NSI.

Mọi khối ảnh đều có chiều rộng các điểm lưới tọa độ tham chiếu XTsiz, chiều cao các điểm lưới tọa độ tham chiếu YTsiz và chiều sâu các điểm lưới tọa độ tham chiếu ZTsiz. Góc trên bên trái mặt trước của khối ảnh đầu tiên (khối ảnh 0) có độ lệch so với góc trên bên trái mặt trước của lưới tọa độ tham chiếu là (XTOsiz, YTOsiz, ZTOsiz). Các khối ảnh được đánh số theo thứ tự quét mành (tức là, từ trái sang phải, cao xuống thấp, trước ra sau). Con số này là chỉ số khối ảnh.

Các độ lệch lưới khối ảnh (XTOsiz, YTOsiz, ZTOsiz) bị giới hạn không được lớn hơn các độ lệch vùng ảnh. Điều này được thể hiện bằng công thức B-3 của ISO/IEC 15444-1 và được bổ sung bằng dải sau đây:

0 ≤ ZTOsiz ≤ ZOsiz (B-3)

Kích thước khối ảnh cộng với độ lệch khối ảnh phải lớn hơn độ lệch vùng ảnh. Điều này đảm bảo rằng khối ảnh đầu tiên (khối ảnh 0) sẽ chứa ít nhất một điểm lưới tọa độ tham chiếu từ vùng ảnh. Điều này đã được thể hiện bởi công thức B-4 của ISO/IEC 15444-1 và được bổ sung bằng dải sau đây:

ZTsiz + ZTOsiz > ZOsiz (B-4)

Số lượng khối ảnh trên chiều ngang (X) (numXtiles) và chiều dọc (Y) (numYtiles) được cho bởi công thức B-5 của ISO/IEC 15444-1. Số lượng khối ảnh trên chiều trục (Z) (numZtiles) được cho như sau:

(B-5)

Để thuận tiện trong việc mô tả thì các khối ảnh cần được đánh số theo vị trí ngang, dọc và trục. Đặt p_x là chỉ số ngang của một khối ảnh và p_y là chỉ số dọc của khối ảnh, khi đó p_z sẽ là chỉ số trục của khối ảnh, lấy từ 0 đến (numZtiles – 1). Công thức sau định nghĩa lại p_x and p_y (Công thức B-6 của T.800 I ISO/IEC 15444-1) và định nghĩa p_z:

p_x = mod(mod(t,numXtiles · numYtiles),numXtiles)

(B-6)

Đối với các tọa độ của một khối ảnh cụ thể trên lưới tọa độ tham chiếu, chúng được mô tả bằng các công thức sau:

tx₀(p_x,p_y,p_z) = max(XTOsiz + p_x · XTsiz,XOsiz)

ty₀(p_x,p_y,p_z) = max(YTOsiz + p_y · YTsiz,YOsiz)

tz₀(p_x,p_y,p_z) = max(ZTOsiz + p_z · ZTsiz,ZOsiz)

tx₁(p_x,p_y,p_z) = min(XTOsiz + (p_x+1) · XTsiz,Xsiz) (B-7)

ty₁(p_x,p_y,p_z) = min(YTOsiz + (p_y+1) · YTsiz,Ysiz)

tz₁(p_x,p_y,p_z) = min(ZTOsiz + (p_z+1) · ZTsiz,Zsiz)

Với tx₀(p_x, p_y, p_z), ty₀(p_x, p_y, p_z) và tz₀(p_x, p_y, p_z) là các tọa độ của góc trên bên trái mặt trước của khối ảnh và tx₁(p_x, p_y, p_z) – 1, ty₁(p_x, p_y, p_z) – 1 và tz₁(p_x, p_y, p_z) – 1 là các tọa độ của góc dưới bên phải mặt sau của khối ảnh. Chúng ta thường bỏ qua các tọa độ của khối ảnh khi nói đến một khối ảnh cụ thể và thay vào đó lại nói đến các tọa độ (tx₀, ty₀, tz₀) và (tx_1, ty₁, tz₁).

Do đó, các chiều của một khối ảnh trên lưới tọa độ tham chiếu là:

(tx₁ – tx₀, ty₁ –ty₀, tz₁ – tz₀₎ (B-8)

Trong miền của thành phần ảnh i, các tọa độ của mẫu trên bên trái mặt trước được cho bởi (tcx₀, tcy₀, tcz₀) và các tọa độ của mẫu dưới bên phải mặt sau dưới được cho bởi (tcx₁, tcy_1, tcz₁), với tcx₀, tcy₀, tcx₁ và tcy₁ đã được mô tả trong Công thức B-12 của ISO/IEC 15444-1 và tcz₀ và tcz₁ được cho bởi công thức sau:

(B-9)

Do vậy, các chiều của khối ảnh-thành phần trong lưới tọa độ tham chiếu là:

(tcx₁ – tcx₀, tcy₁ – tcy₀, tcz₁ – tcz₀) (B-10)

B.5 Phân chia khối ảnh-thành phần biến đổi thành các mức phân giải và các băng con

Đây là nội dung cập nhật B.5 của ISO/IEC 15444-1.

CHÚ THÍCH: Mặc dù ISO/IEC 15444-10 (JP3D) cho phép từng chiều trong ba chiều có số lượng mức phân tách khác nhau (chiều ngang biểu thị bằng X, chiều dọc biểu thị bằng Y và chiều trục bằng Z), điều này về cơ bản là khác với Phụ lục F của ISO/IEC 15444-2: “Sự phân tách tùy ý của các khối ảnh-thành phần”. Sự phân tách của một khối ảnh-thành phần được mô tả trong tiêu chuẩn này KHÔNG PHẢI là tùy ý.

Mỗi khối ảnh-thành phần được biến đổi sóng con với các mức phân tách N_LX trong chiều ngang, các mức phân tách N_LY trong chiều dọc và các mức N_LZ trong chiều trục như được mô tả trong Phụ lục D. Chiều có số lượng mức phân tách lớn nhất cũng quyết định số lượng mức phân giải. Do đó, với N_L = max(N_LX, N_LY, N_LZ) như xác định trong D.3.2, thì sẽ có (N_L + 1) mức phân giải riêng, biểu thị bằng r = 0, 1,…, N_L. Mỗi mức phân giải, r, được thể hiện bằng băng n[L|X][L|X][L|X], có n = N_L – r, với loại băng con thực tế được xác định bằng số lượng phân tách trong mỗi chiều (xem D.4.1). Ví dụ, khi N_LX bằng 3, N_LY bằng 3 và N_LZ bằng 2, thì tại r = 0, mức phân giải thấp nhất được biểu thị bằng băng 3LLX, còn tại r = 1, mức phân giải được biểu thị bằng băng 2LLL. Phần này mô tả các chiều của sự phân giải giảm dần này.

Các tọa độ của một khối ảnh-thành phần nào đó có liên quan đến lưới tọa độ tham chiếu tại một mức phân giải cụ thể, r, sẽ sinh ra các tọa độ của mẫu trên bên trái mặt trước, (trx₀, try₀, trz₀) và các tọa độ của mẫu dưới bên phải mặt sau, (trx₁, try₁ – 1, trz₁ – 1), với:

(B-11)

Theo cách tương tự, các tọa độ khối ảnh có thể được ánh xạ vào băng con bất kỳ, b, sinh ra các tọa độ của mẫu trên bên trái mặt trước (tbx₀, tby₀, tbz₀) và các tọa độ của mẫu dưới bên phải mặt sau (tbx₁– 1, tby₁– 1, tbz₁– 1) với:

(B-12)

với nx_b, ny_b và nz_b, được xác định trong Công thức B-13, thể hiện các mức phân tách tương ứng đối với các hướng ngang (X), hướng dọc (Y) và hướng trục (Z) của băng con b. Các đại lượng (xo_b, yo_b, zo_b) được cho trong Bảng B.1.

nx_b = min(N_L – r + 1, N_LX)

ny_b = min(N_L – r + 1, N_LY) (B-13)

nz_b = min(N_L – r + 1, N_LZ)

Bảng B.1 – Các đại lượng (xo_b, yo_b, zo_b) đối với băng con b

Loại băng con	xo_b	yo_b	zo_b
[L\|X][L\|X][L\|X]	0	0	0
H[L\|X][L\|X]	1	0	0
[L\|X]H[L\|X]	0	1	0
HH[L\|X]	1	1	0
[L\|X][L\|X]H	0	0	1
H[L\|X]H	1	0	1
[L\|X]HH	0	1	1
HHH	1	1	1

Đối với mỗi băng con, các tọa độ này xác định các biên khối ảnh trong các miền băng con riêng biệt. Hơn nữa, kích thước của mỗi băng con được cho bởi:

(tbx₁ – tbx₀, tby₁ – tby₀, tbz₁ – tbz₀) (B-14)

B.6 Phân chia các mức phân giải thành các phân khu

Đây là nội dung cập nhật B.6 của ISO/IEC 15444-1.

Xét một khối ảnh-thành phần cụ thể và mức phân giải có các tọa độ mẫu biên trong miền ảnh phân giải giảm là (trx₀, try₀, trz₀) và (trx₁– 1, try₁ – 1, trz₁– 1), như đã được mô tả ở trên. Tương tự với phương pháp đã được mô tả trong B.6 của ISO/IEC 15444-1, mức phân giải của khối ảnh-thành phần ba chiều được chia thành các phân khu, sử dụng trx₀, trx₁, try₀ và try₁, và cả trz₀ và trz₁. Phân khu này được chốt tại (0, 0, 0), sao cho góc trên bên trái mặt trước của phân khu bất kỳ nào đó khi được phân chia sẽ nằm tại vị trí là các bội số nguyên của (2^PPx, 2^PPy, 2^PPz) với PPx, PPy và PPz đã được báo hiệu trong các đoạn nhãn COD hoặc COC. Cũng như đối với PPx và PPy, PPz có thể khác nhau đối với mỗi khối ảnh- thành phần và mức phân giải. PPz tối thiểu phải bằng 1 đối với mọi mức phân giải r, trừ khi r = 0 thì PPz được phép bằng 0.

Số lượng phân khu của khối ảnh-thành phần tại mức phân giải r được cho bởi Công thức B-16 của ISO/IEC 15444-1 và bởi công thức sau:

trz₁ > trz₀

trz₁ = trz₀

(B-15)

Thậm chí nếu Công thức B-16 của ISO/IEC 15444-1 hoặc B-15 của tiêu chuẩn này chỉ ra rằng cả numprecinctswide, numprecinctshigh, và numprecinctsdeep đều bằng 0, thì một số hoặc tất cả các phân khu đều có thể vẫn trống như đã được giải thích trong B.6 của ISO/IEC 15444-1. Chỉ số phân khu chạy từ 0 đến numprecincts-1 với numprecincts = numprecinctswide·numprecinctshigh·numprecinctsdeep theo thứ tự quét mành (tức là, từ trái sang phải, trên xuống dưới, trước ra sau). Chỉ số này được sử dụng để xác định thứ tự xuất hiện trong dòng mã của các gói tin tương ứng với từng phân khu, như đã được giải thích trong B.12 của ISO/IEC 15444-1.

B.7 Phân chia các băng con thành các khối mã

Đây là nội dung cập nhật B.7 của ISO/IEC 15444-1.

Các băng con được phân chia thành các khối mã 3D dạng khối chữ nhật để dùng cho mục đích mô hình hóa và mã hóa hệ số. Kích thước của mỗi khối mã được xác định từ ba tham số, xcb, ycb và zcb, như đã được báo hiệu trong các đoạn nhãn COD hoặc COC. Kích thước khối mã đối với từng băng con tại một mức phân giải nhất định được xác định là 2^xcb’ x 2^ycb’ x 2^zcb’ với xcb’ và ycb’ được mô tả trong Công thức B-17 và B-18 của ISO/IEC 15444-1 và zcb’ được cho bởi:

zcbʹ =		r > 0	(B-16)
		r = 0

Các công thức này phản ánh một thực tế là kích thước khối mã bị giới hạn bởi cả kích thước phân khu và kích thước khối mã, trong đó các tham số của chúng, xcb, ycb và zcb, là đồng nhất cho mọi băng con trong khối ảnh-thành phần. Giống như đối với phân khu, việc phân chia khối mã được chốt tại (0, 0, 0). Do đó, tất cả các biên của khối mã tham gia vào việc phân chia sẽ có vị trí tại x = g_x2^xcb^ʹ, y = g_y2^ycb^ʹvà z = g_z2^zcb^ʹvới g_x, g_y và g_z là các số nguyên.

B.8 Gói tin

Đây là nội dung cập nhật B.9 của ISO/IEC 15444-1.

Mọi dữ liệu ảnh nén thể hiện một khối ảnh, lớp, thành phần, mức phân giải và phân khu nào đó xuất hiện trong dòng mã trong một đoạn tiếp giáp đều được gọi là gói tin. Dữ liệu gói tin được phân định tại các biên 8-bit (một byte).

Như được xác định trong Phụ lục D, mức phân giải r = 0 chứa các hệ số băng con của băng N_LLLL, với N_L là số lượng mức phân tách được xác định trong D.3.2. Mỗi mức phân giải tiếp theo, r > 0, chứa các hệ số băng con của các băng con n[L|H|X][L|H|X][L|H|X], trừ nLLL, như được xác định trong Phụ lục D, với n = N_L – r + 1. Mỗi khối ảnh-thành phần có N_L mức phân tách sẽ có (N_L + 1) mức phân giải.

Dữ liệu ảnh nén trong mỗi gói tin được lập thứ tự sao cho sự đóng góp từ các băng con LLL, XLL, LXL, LLX, LXX, XLX, XXL, HLL, HXL, HLX, HXX, LHL, XHL, LHX, XHX, HHL, HHX, LLH, XLH, LXH, XXH, HLH, HXH, LHH, XHH và HHH cũng xuất hiện theo thứ tự đó (tức là, thứ tự quét Morton). Trong mỗi băng con, các đóng góp của khối mã xuất hiện theo thứ tự quét mành, giới hạn ở các biên được thiết lập bởi phân vùng liên quan. Mức phân giải r = 0 chỉ chứa băng N_LLLL và các mức phân giải r > 0 có thể chỉ chứa một vài trong số N_L[L|H|X][L|H|X][L|H|X] băng, trừ N_LLLL. Chỉ các khối mã chứa các mẫu từ băng con liên quan, giới hạn trong phân vùng, mới có mặt trong gói tin đó.

Dữ liệu gói tin được chứa trong phần tiêu đề gói tin có cú pháp mô tả trong B.10 của ISO/IEC 15444-1 và sau đó là thân gói tin chứa các byte mã thực tế được đóng góp bởi từng khối mã liên quan. Thứ tự xác định ở trên được tuân thủ trong việc xây dựng cả tiêu đề gói tin và thân gói tin.

B.9 Mã hóa thông tin tiêu đề gói tin

Cập nhật của B.10 của ISO/IEC 15444-1.

B.9.1 Cây thẻ

B.10.2 của T.8001 | ISO/IEC 15444-1 mô tả các cây thẻ hai chiều. Các cây thẻ ba chiều được yêu cầu cho mục đích mở rộng ba chiều.

Cây thẻ 3D là cách thể hiện mảng ba chiều của các số nguyên không âm theo phương thức phân cấp.

Cây thẻ 3D lần lượt thiết lập các mức phân giải giảm dần của mảng ba chiều, hình thành một cây. Tại mọi điểm của cây, số nguyên nhỏ nhất của các điểm đỉnh (tối đa là 8) bên dưới được ghi lại. Ký hiệu q_i(m_x, m_y, m_z) là giá trị tại điểm thứ m_x từ phía trái, thứ m_y từ trên và thứ m_z từ mặt trước, ở mức thứ i. Mức 0 là mức thấp nhất của cây thẻ và chứa điểm cao nhất.

Xem B.10.2 của ISO/IEC 15444-1 để có thêm thông tin về cách thức mã hóa và giải mã thực tế cho các giá trị theo cây thẻ. Các mô tả trong tài liệu này không phụ thuộc vào số lượng chiều thực tế.

B.9.2 Thứ tự thông tin trong gói tin

Đây là nội dung cập nhật B.10.8 của ISO/IEC 15444-1.

Dưới đây là thứ tự thông tin tiêu đề gói tin của gói tin thuộc một lớp, khối ảnh-thành phần, mức phân giải và phân vùng nhất định.

bit đối với gói có độ dài bằng 0 hoặc khác 0

đối với từng băng con ([L|H|X][L|H|X][L|H|X])

đối với tất cả các khối mã trong băng con này được giới hạn trong phân khu ảnh liên quan, theo thứ tự quét mành

các bit bao hàm khối mã (nếu không bao gồm trước đây thì là cây ghi nhãn hoặc một bit) nếu khối mã bao gồm

nếu đối tượng đầu tiên của khối mã

thông tin mặt phẳng bit

số lượng bước mã hóa bao gồm

tăng chỉ số độ dài khối mã (Lblock)

đối với từng đoạn từ mã

chiều dài đoạn từ mã

B.10 Thứ tự lũy tiến

Đây là nội dung cập nhật B.12 của ISO/IEC 15444-1.

Đối với mỗi khối ảnh-bộ phận, các gói tin đều chứa tất cả các dữ liệu ảnh nén từ một lớp, một thành phần, một mức phân giải, và một phân vùng cụ thể. Thứ tự xuất hiện của các gói tin này trong dòng mã được gọi là thứ tự lũy tiến. Việc lập thứ tự các gói tin có thể thực hiện trên bốn trục: lớp, thành phần, mức phân giải và phân khu.

Các thành phần có thể có số lượng mức phân giải khác nhau. Trong trường hợp này, mức phân giải tương ứng với băng con N_LLLL là mức phân giải đầu tiên (r = 0) đối với mọi thành phần. Các chỉ số được đồng bộ từ điểm này trở đi.

B.10.1 Xác định thứ tự lũy tiến

Phần này mô tả các thuật toán xác định năm thứ tự lũy tiến có thể. Về cơ bản, chúng giống các thuật toán đã được mô tả trong B.12.1 của ISO/IEC 15444-1, nhưng được mở rộng thành ba chiều. Các đường nét đậm chỉ ra các bổ sung cần thiết cho chiều thứ ba.

Các đoạn nhãn COD báo hiệu thứ tự được sử dụng trong số năm thứ tự lũy tiến (xem A.6.1 của ISO/IEC 15444-1). Thứ tự lũy tiến có thể còn bị ghi đè với đoạn nhãn POC (xem A.6.6 của ISO/IEC 15444-1) trong mọi tiêu đề khối ảnh-bộ phận. Đối với mỗi thứ tự lũy tiến có thể, cơ chế để xác định thứ tự lũy tiến của các gói tin sẽ được mô tả dưới đây.

B.10.1.1 Lũy tiến lớp-mức phân giải-thành phần-vị trí

Xem B.12.1.1 của ISO/IEC 15444-1.

B.10.1.2 Lũy tiến mức phân giải-lớp-thành phần-vị trí

Xem B.12.1.2 của ISO/IEC 15444-1.

B.10.1.3 Lũy tiến mức phân giải-vị trí-thành phần-lớp

Lũy tiến mức phân giải-vị trí-thành phần-lớp đối với ba chiều được định nghĩa là sự chèn các gói tin theo thứ tự sau:

đối với mỗi r = 0,…, Nmax

đối với mỗi z = tz₀,…, tz₁ – 1,

đối với mỗi y = ty₀,…, ty₁ – 1,

đối với mỗi x = tx₀,…, tx₁ – 1,

đối với mỗi i = 0,…, Csiz – 1

nếu ((z chia hết cho ZRsiz(i) x ) OR ((z = tz₀) AND (trz₀ x

không chia hết cho )))

nếu ((y chia hết cho YRsiz(i) x ) OR ((y = ty₀) AND (try₀ x

không chia hết cho )))

nếu ((x chia hết cho XRsiz(i) x ) OR ((x = tx₀) AND (trx₀ x

không chia hết cho )))

đối với phân khu ảnh kế tiếp, k, nếu nó tồn tại,

đối với mỗi I = 0,…, L-1

gói cho thành phần ảnh I, mức phân giải r, lớp ảnh I, và phân khu ảnh k

Trong đó, k có thể thu được từ công thức sau:

(B-17)

Để áp dụng lũy tiến này, các giá trị XRsiz, YRsiz và ZRsiz phải là lũy thừa hai đối với mỗi thành phần.

B.10.1.4 Lũy tiến vị trí-thành phần-mức phân giải-lớp

Lũy tiến vị trí-thành phần-mức phân giải-lớp được định nghĩa là sự chèn các gói tin theo thứ tự sau:

đối với mỗi z = tz₀,…, tz₁– 1,

đối với mỗi y = ty₀,…, ty₁– 1,

đối với mỗi x = tx₀,…, tx₁– 1,

đối với mỗi i = 0,…, Csiz – 1

đối với mỗi r = 0,…, Nmax, với N_L là số mức phân tách đối với thành phần I,

nếu ((z chia hết cho ZRsiz(i) x ) OR ((z = tz₀) AND (tz₀ x

không chia hết cho )))

nếu ((y chia hết cho YRsiz(i) x ) OR ((y = ty₀) AND (try₀ X

không chia hết cho )))

nếu ((x chia hết cho XRsiz(i) x ) OR ((x = tx₀) AND (trx₀ x

không chia hết cho )))

đối với phân khu ảnh kế tiếp, k, nếu nó tồn tại,

đối với mỗi I = 0,..., L-1

gói cho thành phần ảnh I, mức phân giải r, lớp ảnh l, và phân khu ảnh k

Trong đó, k có thể được nhận từ Công thức B-17. Để áp dụng lũy tiến này, các giá trị XRsiz, YRsiz và ZRsiz phải là lũy thừa hai đối với mỗi thành phần.

B.10.1.5 Lũy tiến thành phần-vị trí-mức phân giải-lớp

Lũy tiến thành phần-vị trí-mức phân giải-lớp được định nghĩa là sự chèn các gói tin theo thứ tự sau:

đối với mỗi i = 0,…, Csiz -1

đối với mỗi z = tz₀,…, tz₁– 1,

đối với mỗi y = ty₀,…, ty₁– 1,

đối với mỗi x = tx₀,…, tx₁– 1,

đối với mỗi r = 0,…, Nmax, với N_L là số mức phân tách đối với thành phần I,

nếu ((z chia hết cho ZRsiz(i) x ) OR ((z = tz₀) AND (trz₀ x

không chia hết cho )))

nếu ((y chia hết cho YRsiz(i) x ) OR ((y = ty₀) AND (try₀ x

không chia hết cho )))

nếu ((x chia hết cho XRsiz(i) x ) OR ((x = tx₀) AND (trx₀ x

không chia hết cho )))

đối với phân khu ảnh kế tiếp, k, nếu nó tồn tại,

đối với mỗi I = 0,…, L – 1

gói cho thành phần ảnh I, mức phân giải r, lớp ảnh l, và phân khu ảnh k

Trong đó, k có thể nhận được từ Công thức B-17.

Phụ lục C

(Quy định)

Mô hình hóa bit hệ số

C.1. Giới thiệu

Trong phụ lục này và các điều nhỏ của phụ lục, các sơ đồ và bảng chỉ có tính bắt buộc nếu chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này chính thức mở rộng Phụ lục D của ISO/IEC 15444-1 thêm tính năng mã hóa khối

Phụ lục này đề cập đến việc mô hình hóa và quét các bit hệ số biến đổi.

Các khối mã (xem Phụ lục B) được mã hóa phẳng bit tại một thời điểm tính từ mặt phẳng bit có ý nghĩa cao nhất có một phần tử khác 0 đến mặt phẳng bit có ý nghĩa thấp nhất. Đối với mỗi mặt phẳng bit trong khối mã, một kiểu quét khối mã đặc biệt được sử dụng cho mỗi quá trình mã hóa trong ba quá trình mã hóa. Mỗi bit hệ số trong mặt phẳng bit chỉ xuất hiện trong một trong ba thẻ mã hóa được gọi là lan truyền có nghĩa, tinh chỉnh biên độ và làm sạch. Đối với mỗi thẻ, các ngữ cảnh được thiết lập cho bộ mã hóa và giải mã số học, CX, cùng với dòng bit, CD (xem C.3 của. ISO/IEC 15444-1).

C.2. Kiểu quét khối mã trong các khối mã, phần mở rộng

Mỗi mặt phẳng bit của một khối mã đều được quét theo một thứ tự riêng. Khối mã 3D được xử lý theo sọc, mỗi sọc, chứa bốn hàng (hoặc tất cả các hàng còn lại nếu ít hơn bốn) và trải theo chiều rộng của khối mã 3D. Mỗi sọc được xử lý theo từng cột từ trên xuống dưới và từ trái sang phải. Do đó, toàn bộ khối mã 3D được quét theo từng lát ảnh. Trong mỗi lát ảnh, tuân thủ theo ISO/IEC 15444-1.

C.3. Các cập nhật về mô hình ngữ cảnh

Đối với việc mô hình hóa ngữ cảnh, mô hình được mô tả trong Phụ lục D của ISO/IEC 15444-1 được thay đổi theo các quá trình mã hóa lan truyền có nghĩa và làm sạch.

Vectơ ngữ cảnh đối với một hệ số hiện tại cụ thể là vectơ nhị phân gồm các trạng thái trọng số của 8 hệ số bên cạnh gần nhất trong mặt phẳng XY, như mô tả trong Hình D.2 của ISO/IEC 15444-1. Mọi hệ số bên cạnh gần nhất nằm ngoài khối mã của hệ số hiện tại đều được coi là không có nghĩa (tức là, chúng được coi như có trạng thái trọng số bằng 0) khi thiết lập vectơ ngữ cảnh để giải mã hệ số hiện tại.

Thay cho Bảng D.1 của ISO/IEC 15444-1, các ngữ cảnh liên quan được quy định trong Bảng C.1 bên dưới.

Bảng C.1 – Các ngữ cảnh đối với các quá trình mã hóa lan truyền có nghĩa và làm sạch

Các băng con có định hướng chính L[L\|H\|X][L\|H\|X], X[L\|H][L\|H\|X] hoặc XX[L\|H]			Các băng con có định hướng chính H[L\|X][L\|H\|X]			Các băng con có định hướng chính HH[L\|H\|X]		Nhãn ngữ cảnh^a)

2	x^b)	x	x	2	x	x	≥ 3	8
1	≥ 1	x	≥ 1	1	x	≥ 1	2	7
1	0	≥ 1	0	1	≥ 1	0	2	6
1	0	0	0	1	0	≥ 2	1	5
0	2	x	2	0	x	1	1	4
0	1	x	1	0	x	0	1	3
0	0	≥ 2	0	0	≥ 2	≥ 2	0	2
0	0	1	0	0	1	1	0	1
0	0	0	0	0	0	0	0	0
a) Lưu ý rằng các nhãn ngữ cảnh được đánh số chỉ để tiện lợi trong việc định danh ở tiêu chuẩn này. Các định danh thực tế sẽ cần được xem xét khi triển khai. b) x = “không quan tâm”.

Phụ lục D

(Quy định)

Biến đổi sóng con rời rạc của các khối ảnh – thành phần

D.1 Giới thiệu

Trong phụ lục này và các điều nhỏ của phụ lục, các lưu đồ và bảng chỉ có tính bắt buộc khi chúng chỉ rõ đầu ra mà các triển khai khác sẽ phải tuân thủ.

Phụ lục này mô tả biến đổi sóng con rời rạc thuận ba chiều được áp dụng cho mỗi khối ảnh–thành phần và chỉ rõ biến đổi sóng con rời rạc ngược ba chiều được sử dụng để phục dựng khối ảnh-thành phần [3], [4] và [5]. Về cơ bản, phụ lục này mở rộng Phụ lục F của ISO/IEC 15444-1 thêm chức năng mã hóa khối.

D.2 Các tham số khối ảnh-thành phần

Xét khối ảnh-thành phần được xác định bởi các tọa độ tcx₀, tcx₁, tcy₀, tcy₁, tcz₀ và tcz₁ cho trong Công thức B-12 của ISO/IEC 15444-1 và Công thức B-9 của tiêu chuẩn này. Khi đó, các tọa độ (x,y,z) của khối ảnh-thành phần (có các giá trị mẫu l(x,y,z)) nằm trong dải xác định bởi:

tcx₀ ≤ x < tcx₁, tcy₀ ≤ y < tcy₁ và tcz₀ ≤ z < tcz₁(D-1)

D.3 Biến đổi sóng con rời rạc

D.3.1 Lọc thông thấp và thông cao (tham khảo)

Xem F.2.1 của ISO/IEC 15444-1.

D.3.2 Các mức phân tách

Mỗi khối ảnh-thành phần được biến đổi thành một tập các tín hiệu băng con ba chiều (được gọi là các băng con), mỗi tín hiệu băng con thể hiện hoạt động của tín hiệu trong các băng tần khác nhau, tại các phân giải không gian khác nhau. N_LX biểu thị số lượng mức phân tách theo chiều ngang, N_LY biểu thị số mức phân tách theo chiều dọc và N_LZ biểu thị số lượng mức phân tách theo chiều trục. Trong tiêu chuẩn này, N_L = max(N_LX, N_LX, N_LX).

D.3.3 Các bộ lọc sóng con rời rạc (tham khảo)

Xem F.2.3 của ISO/IEC 15444-1.

D.4 Biến đổi sóng con rời rạc nghịch

D.4.1 Thủ tục IDWT

Biến đổi sóng con rời rạc nghịch (IDWT) biến đổi một tập các băng con, a_b(u_b,v_b,w_b) thành một khối ảnh-thành phần dịch mức DC, l(x, y, z) (thủ tục IDWT). Thủ tục IDWT (xem Hình D.1) có đầu vào là tập các tham số N_LX, N_LY và N_LZ, chúng thể hiện số lượng mức phân tách ở mỗi chiều của ba chiều và được báo hiệu trong các nhãn COD hoặc COC (xem A.2.2 và A.2.3).

Hỉnh D.1 – Các đầu vào và đầu ra của thủ tục IDWT

Các băng con được gán nhãn theo cách sau: một chỉ số lev tương ứng với mức phân tách, tiếp đó là ba chữ cái trong số L, H hoặc X. Do đó, mỗi nhãn băng con sẽ có dạng Iev[L|H|X][L|H|X][L|H|X].

Băng con b = Iev[L|X][L|X][L|X] tương ứng với một phiên bản giảm kích thước của băng con (lev– 1)[L|X][L|X][L|X] qua lọc thông thấp cho các hướng (ngang, dọc và/hoặc trục) thể hiện bằng chữ cái L. Nếu tại mức phân tách (lev – 1), một hướng nào đó không được lọc thông thấp (tức là, chữ cái X được sử dụng), thì tín hiệu có thể không được lọc thông thấp nữa ở mọi mức phân tách cao hơn tiếp theo, n > (lev – 1). Do đó, khi số lượng phân tách ở hướng d (với d là X, Y hoặc Z), N_Ld nhỏ hơn lev thì loại phân tách của chiều tương ứng là X; ngược lại sẽ là L. Băng con b = 0LLL tương ứng với khối ảnh- thành phần ban đầu.

Tương tự như F.3.1 của ISO/IEC 15444-1, các băng con được báo hiệu trong dòng mã theo thứ tự như sau:

N_LLLL, N_LXLL, N_LLXL, N_LLLX, N_LLLX, N_LXLX, N_LXXL, N_LHLL, N_LHXL, N_LHLX, N_LHXX, N_LLHL, N_LXHL, N_LLHX, N_LXHX, N_LHHL, N_LHHX, N_LLLH, N_LXLH, N_LLXH, N_LXXH, N_LHLH, N_LHXH, N_LLHH, N_LXHH, N_LHHH, (N_L-1)HHL, (N_L-1)HXL, (N_L-1)HLX, (N_L-1)HXX, (N_L-1)LHL, (N_L-1)XHL, (N_L-1)LHX, …, 1XHX, 1HHL, 1HHX, 1LLH, 1XLH, 1LXH, 1XXH, 1HLH, 1HXH, 1LHH, 1XHH, 1HHH.

Lưu ý rằng, trong danh sách các băng con ở trên, chỉ các băng con tồn tại, có các tham số N_LX, N_LY và N_LZ, là sẽ có mặt trong dòng mã. Đây là các băng con chính xác cần để phục dựng đầy đủ khối ảnh- thành phần ban đầu.

Hình D.2 – Thủ tục IDWT

Như trong F.3.1 của ISO/IEC 15444-1, thủ tục IDWT bắt đầu với việc khơi tạo biến lev (mức phân tách hiện tại) thành N_L. Thủ tục 3D_SR (xem D.4.2) được thực hiện tại mọi mức lev, với mức lev giảm ở mỗi lần lặp, cho đến khi N_L lần lặp được hoàn tất. Thủ tục 3D_SR được lặp lại ở băng con lev[L|X][L|X][L|X] sinh ra tại mỗi lần lặp.

Cuối cùng, băng con a_0LLL(u₀_LLL,u₁_LLL,v₀_LLL,v_1LLL,w_0LLL,w_1LLL) sẽ là mảng đầu ra l(x, y, z).

Như đã được định nghĩa trong Công thức B-12, chỉ số của các hệ số băng con đối với một băng con b nhất định sẽ nằm trong dải được xác định bởi:

tbx₀ ≤ u_b < tbx₁, tby₀ ≤ v < tby₁ và tbz₀ ≤ w_b < tbz₁(D-2)

D.4.2 Thủ tục 3D_SR

Thủ tục 3D_SR thực hiện phục dựng băng con a_{(lev-1)[L|X][L|X][L|X]}(u,v,w) từ các băng con a_lev_{[L|H|X][L|H|X][L|H|X]}(u,v,w) nhất định. Đầu vào của 3D_SR là tổng số lượng hệ số của băng con (lev– 1)[L|X][L|X][L|X] được phục dựng và bằng tổng các tổng số lượng hệ số của các băng con được sử dụng.

Hình D.3 – Các đầu vào và đầu ra của thủ tục 3D_SR

Các băng con a_lev_{[L|H|X][L|H|X][L|H|X]}(u,v,w) được hợp nhất thành mảng a(u,v,w) bằng thủ tục TO_ARRAY. Mảng tạm thời này được sử dụng để khôi phục các kết quả trung gian và được cập nhật ngay khi thủ tục 3D_SR được thực thi. Tiếp theo, thủ tục 3D_SR sẽ phục dựng mỗi hướng d, trong đó lev < N_Ld ≤ N_L với d là X, Y hoặc Z, bằng các thủ tục tương ứng HOR_SR, VER_SR và AXIAL_SR. Kết quả cuối cùng là băng con a_(lev-1)_{[L|X][L|X][L|X]}(u,v,w). Hình D.4 mô tả chi tiết thủ tục 3D_SR.

Hình D.4 – Thủ tục 3D_SR

D.4.3 Thủ tục TO_ARRAY

Như mô tả trong Hình D.6, thủ tục TO_ARRAY thực hiện với tất cả các băng con của mức phân tách lev và hợp nhất chúng thành một mảng ba chiều a(u,v,w). Thủ tục này có đầu vào là các băng con a_lev_{[L|H|X][L|H|X][L|H|X]}(u,v,w) và khoảng hệ số theo chiều ngang, dọc và trục của băng con a_(lev-1)_{[L|X][L|X][L|X]}(u,v,w) là u₀,u₁,v₀,v₁,w₀ and w₁. Mảng đầu ra có khoảng hệ số theo chiều ngang, dọc và trục là u₀ ≤ u < u₁, v₀ ≤ v < v₁ và w₀ ≤ w < w₁.

Hình D.5 – Các đầu vào và đầu ra của thủ tục TO_ARRAY

Hình D.6 – Các cấu hình băng con có thể đối với 3D DWT

D.4.4 Thủ tục 1D_INTERLEAVE

Như được thể hiện trên Hình D.7, thủ tục 1D_INTERLEAVE chèn các hệ số thông thấp và thông cao của biến đổi sóng con. Thủ tục này có đầu vào là một tín hiệu một chiều Y(n) và sắp xếp lại các giá trị hệ số trong tín hiệu bằng cách chèn chúng. Các giá trị của i₀ và i₁ tương ứng được sử dụng bởi thủ tục 1D_INTERLEAVE thể hiện sự bắt đầu và kết thúc của tín hiệu. Cách thức mà tín hiệu được chèn để hình thành đầu ra được mô tả bởi thủ tục 1D_INTERLEAVE, như trong Hình D.8.

Hình D.7 – Các tham số của thủ tục 1D_INTERLEAVE

Hình D.8 – Thủ tục 1D_INTERLEAVE

D.4.5 Thủ tục HOR_SR

Thủ tục HOR_SR thực hiện việc chèn và phục dựng băng con theo chiều ngang của mảng hệ số ba chiều. Thủ tục này có đầu vào là mảng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của màng là u₀ ≤ u < u₁, v₀ ≤ v < v₁ và w₀ ≤ w < w₁ (xem Hình D.9) và sinh ra đầu ra là một phiên bản lọc theo chiều ngang của mảng đầu vào cho từng hàng và từng lát ảnh.

Hình D.9 – Các đầu vào và đầu ra của thủ tục HOR_SR

Như thể hiện trên Hình D.10, thủ tục HOR_SR áp dụng việc phục dựng băng con một chiều (thủ tục 1D_SR) cho mỗi hàng của mảng đầu vào a(u,v,w), và khôi phục kết quả trở lại mỗi hàng.

Hình D.10 – Thủ tục HOR_SR

D.4.6 Thủ tục VER_SR

Thủ tục VER_SR thực hiện việc chèn và phục dựng băng con theo chiều dọc của mảng hệ số ba chiều. Thủ tục này có đầu vào là mảng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của màng là u₀ ≤ u < u₁, v₀ ≤ v < v₁ và w₀ ≤ w < w₁ (xem Hình D.11) và sinh ra đầu ra là phiên bản lọc theo chiều ngang của mảng đầu vào cho từng cột và từng lát ảnh.

Như được thể hiện trên Hình D.12, thủ tục VER_SR áp dụng việc phục dựng băng con một chiều (thủ tục 1D_SR) cho mỗi cột của mảng đầu vào a(u,v,w), và khôi phục kết quả trở lại mỗi cột.

Hình D.11 – Các đầu vào và đầu ra của thủ tục VER_SR

Hình D.12 – Thủ tục VER_SR

D.4.7 Thủ tục AXIAL_SR

Thủ tục AXIAL_SR thực hiện việc chèn và phục dựng băng con theo trục của mảng hệ số ba chiều. Thủ tục này có đầu vào là một mảng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của mảng là u₀ ≤ u < u₁, v₀ ≤ v < v₁ và w₀ ≤ w < w₁ (xem Hình D.13) và sinh ra đầu ra là phiên bản lọc theo chiều ngang của mảng đầu vào cho từng hàng và từng cột.

Như được mô tả trên Hình D.14, thủ tục AXIAL_SR áp dụng việc phục dựng băng con một chiều (thủ tục 1D_SR) cho mỗi chiều sâu của mảng đầu vào a(u,v,w), và khôi phục kết quả trở lại trong mỗi chiều sâu.

Hình D.13 – Các đầu vào và đầu ra của thủ tục AXIAL_SR

Hình D.14 – Thủ tục AXIAL_SR

D.4.8 Thủ tục 1D_SR

F.3.6 của ISO/IEC 15444-1 đã mô tả thủ tục 1D_SR được sử dụng để thực hiện phục dựng băng con. Ngoài ra, tất cả các thủ tục và mô tả tiếp theo, dù trực tiếp hoặc gián tiếp được yêu cầu bởi thủ tục 1D_SR, cũng đã được đề cập trong Phụ lục F của ISO/IEC 15444-1.

D.5 Biến đổi thuận (tham khảo)

D.5.1 Thủ tục FDWT (tham khảo)

Biến đổi sóng con rời rạc thuận (FDWT) biến đổi các mẫu khối ảnh-thành phần dịch mức DC l(x,y,z) thành một tập các băng con có các hệ số a_b(u_b,v_b,w_b) (thủ tục FDWT). Thủ tục FDWT (xem Hình D.15) có đầu vào là số lượng mức phân tách trong mỗi chiều của ba chiều và đã được báo hiệu trong các nhãn COD hoặc COC (xem A.2.2 và A.2.3).

Như trong F.4.1 của 1SO/IEC 15444-1 đã đề cập, thủ tục FDWT bắt đầu với việc khởi tạo biến lev (mức phân tách hiện tại) thành 1 và phân bổ mảng ba chiều l(x,y,z) vào băng con a_0LLL(u_0LLL,u_1LLL,v_0LLL,v_1LLL,w_0LLL,w_1LLL). Thủ tục 3D_SD (xem D.5.2) được thực hiện tại mọi mức lev, trong đó mức Iev tăng thêm một ở mỗi lần lặp cho đến khi N_L lần lặp hoàn tất. Thủ 3D_SD được lặp lại trên toàn băng con (lev-1)[L|X][L|X][L|X] được sinh ra tại mỗi lần lặp.

Toàn bộ thủ tục FDWT được mô tả chi tiết trên Hình D.16.

Tương tự với những gì đã được mô tả trong Phụ lục F của ISO/IEC 15444-1, các băng con được sinh ra sẽ được báo hiệu trong dòng mã theo thứ tự dưới đây:

N_LLLL, N_LXLL, N_LLXL, N_LLLX, N_LLXX, N_LXLX, N_LXXL, N_LHLL, N_LHXL, N_LHLX, N_LHXX, N_LLHL, N_LXHL, N_LLHX, N_LXHX, N_LHHL, N_LHHX, N_LLLH, N_LXLH, N_LLXH, N_LXXH, N_LHLH, N_LHXH, N_LLHH, N_LXHH, N_LHHH, (N_L-1)HLL, (N_L-1)HXL, (N_L-1)HLX, (N_L-1)HXX, (N_L-1)LHL, (N_L-1)XHL, (N_L-1)LHX, …., 1XHX, 1HHL, 1HHX, 1LLH, 1XLH, 1LXH, 1XXH, 1HLH, 1HXH, 1LHH, 1XHH, 1HHH.

Lưu ý rằng, trong danh sách các băng con ở trên, chỉ các băng con tồn tại, có các tham số N_LX, N_LY và N_L_Z, là sẽ có mặt trong dòng mã. Đây là các băng con chính xác cần thiết để phục dựng đầy đủ khối ảnh-thành phần. Cũng lưu ý thêm rằng, N_L[L|X][L|X][L|X] chỉ là băng con loại [L|X][L|X][L|X] đã được báo hiệu trong dòng mã.

Hình D.15 – Các đầu vào và đầu ra của thủ tục FDWT

Hình D.16 – Thủ tục FDWT

D.5.2 Thủ tục 3D_SD (tham khảo)

Thủ tục 3D_SD thực hiện việc phân tách mảng hệ số hoặc mẫu ba chiều a_{(lev-1)[L|X][L|X][L|X]}(u,v,w) thành nhiều nhóm các hệ số băng con a_lev_{[L|H|X][L|H|X][L|H|X]}(u,v,w), tùy thuộc vào số lượng phân tách N_LX, N_LY và N_LZ.

Tổng số lượng hệ số của băng con (lev– 1)[L|X][L|X][L|X] bằng tổng các tổng số lượng hệ số của các băng con lev[L|H|X][L|H|X][L|H|X] sinh ra từ thủ tục 3D_SD.

Hình D.17 – Các đầu vào và đầu ra của thủ tục 3D_SD

Thủ tục 3D_SR (xem Hình D.18) phân tách mỗi hướng, d, trong đó mỗi hướng có lev < N_Ld ≤ N_L, với d là X, Y hoặc Z, tương ứng bằng các thủ tục HOR_SD, VER_SD và AXIAL_SD. Tiếp theo, mảng ba chiều a(u,v,w) được chia thành các băng con được phục dựng khác nhau a_lev_{[L|H|X][L|H|X][L|H|X]}(u,v,w). Trong các băng con này, băng con lev[L|X][L|X][L|X] được sử dụng ở lần lặp tiếp theo của thủ tục FDWT để tiếp tục được phân tách (miễn sao có ít hơn N_L lần lặp). Các băng con khác tiếp tục được xử lý để báo hiệu trong dòng mã.

Hình D.18 – Thủ tục 3D_SD

D.5.3 Thủ tục TO_SUBBANDS (tham khảo)

Thủ tục TO_SUBBANDS có đầu vào là mảng ba chiều a(u,v,w) và đầu ra là các băng con sau khi đã được hoàn lại, như được mô tả trong Hình D.6. Mảng a(u,v,w) có khoảng hệ số theo chiều ngang, dọc và trục là u₀ ≤ u < u₁, v₀ ≤ v < v₁ và w₀ ≤ w < w₁.

D.5.4 Thủ tục AXIAL_SD (tham khảo)

Thủ tục AXIAL_SD thực hiện việc phân tách băng con của mảng hệ số ba chiều theo trục. Thủ tục này có đầu vào là mảng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của mảng là u₀ ≤ u < u₁, v₀ ≤ v < v₁ và w₀ ≤ w < w₁ (xem Hình D.19) và sinh ra đầu ra là phiên bản lọc theo trục của mảng đầu vào, cho từng hàng và từng cột. Sau phân tách là quá trình giải lặp.

Như được mô tả trên Hình D.20, thủ tục AXIAL_SD áp dụng việc phân tách băng con một chiều (thủ tục 1D_SD) cho mỗi chiều sâu của mảng đầu vào a(u,v,w), và khôi phục kết quả ở lại cho mỗi chiều sâu.

Hình D.19 – Các đầu vào và đầu ra của thủ tục AXIAL_SD

Hình D.20 – Thủ tục AXIAL_SD

D.5.5 Thủ tục VER_SD (tham khảo)

Thủ tục VER_SD thực hiện việc phân tách băng con của mảng hệ số ba chiều theo chiều dọc. Thủ tục này có đầu vào là mảng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của mảng là u₀ ≤ u < u₁, v₀ ≤ v < v₁ và w₀ ≤ w < w₁ (xem Hình D.21) và sinh ra đầu ra là một phiên bản lọc theo chiều dọc của mảng đầu vào, cho từng cột và từng lát ảnh. Sau phân tách là quá trình giải chèn.

Như được mô tả trên Hình D.22, thủ tục VER_SD áp dụng việc phân tách băng con một chiều (thủ tục 1D_SD cho mỗi cột của mảng đầu vào a(u,v,w), và khôi phục kết quả trở lại trong mỗi cột.

Hình D.21 – Các đầu vào và đầu ra của thủ tục VER_SD

Hình D.22 – Thủ tục VER_SD

D.5.6 Thủ tục HOR_SD (tham khảo)

Thủ tục HOR_SD thực hiện việc phân tách băng con của mảng hệ số ba chiều theo chiều ngang. Thủ tục này có đầu vào là mảng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của mảng là u₀ ≤ u < u₁, v₀ ≤ v < v₁ và w₀ ≤ w < w₁ (xem Hình D.23) và sinh ra đầu ra là một phiên bản lọc theo chiều ngang của mảng đầu vào, cho từng hàng và từng lát ảnh. Sau phân tách là quá trình giải chèn.

Như được mô tả trên Hình D.24, thủ tục HOR_SD áp dụng việc phân tách băng con một chiều (thủ tục 1D_SD) lên mỗi hàng của mảng đầu vào a(u,v,w), và khôi phục kết quả trở lại trên mỗi hàng.

Hình D.23 – Các đầu vào và đầu ra của thủ tục HOR_SD

Hình D.24 – Thủ tục HOR_SD

D.5.7 Thủ tục 1D_DEINTERLEAVE (tham khảo)

Như được mô tả trên Hình D.25, thủ tục 1D_DEINTERLEAVE giải chèn các hệ số thông thấp và thông cao của biến đổi sóng con. Thủ tục này có đầu vào là tín hiệu một chiều, X(n), và sắp xếp lại các giá trị hệ số trong tín hiệu bằng cách giải chèn chúng. Các giá trị của i₀ và i₁ tương ứng được sử dụng bởi thủ tục 1D_DEINTERLEAVE thể hiện sự bắt đầu và kết thúc của tín hiệu. Cách thức mà tín hiệu được giải chèn để hình thành đầu ra được mô tả bởi thủ tục 1D_DEINTERLEAVE như trên Hình D.26.

Hình D.25 – Các tham số của thủ tục 1D_DEINTERLEAVE

Hình D.26 – Thủ tục 1D_DEINTERLEAVE

D.5.8 Thủ tục 1D_SD (tham khảo)

F.4.6 của ISO/IEC 15444-1 đã mô tả thủ tục 1D_SD được sử dụng để thực hiện việc phân tách băng con. Ngoài ra, tất cả các thủ tục và đặc tả tiếp theo, dù trực tiếp hoặc gián tiếp cần cho thủ tục 1D_SD, cũng đã được cho trong Phụ lục F của ISO/IEC 15444-1.

Phụ lục E

(Quy định)

Lượng tử hóa

E.1 Giới thiệu

Trong phụ lục này và các điều nhỏ của phụ lục, các lưu đồ và bảng chỉ có tính bắt buộc khi chúng chỉ rõ đầu ra mà các triển khai khác phải tuân thủ. Phụ lục này quy định các khía cạnh liên quan đến sự lượng tử hóa của các hệ số biến đổi khối ảnh-thành phần. Các khía cạnh lượng tử hóa đã được chỉ rõ trong Phụ lục E của ISO/IEC 15444-1, nhưng sẽ được mở rộng để định nghĩa sự lượng tử hóa các phân tách ba chiều trong tiêu chuẩn này.

E.2 Các biến thể của thủ tục lượng tử hóa nghịch

Thủ tục lượng tử hóa sẽ phải giống như đã quy định trong Phụ lục E của ISO/IEC 15444-1, ngoại trừ những sửa đổi ở đây nhằm phù hợp với các cấu trúc phân tách ba chiều của tiêu chuẩn này.

Các băng con cũng giống như đã được chỉ rõ trong Phụ lục E của ISO/IEC 15444-1, ngoại trừ việc có nhiều băng con hơn cho các phân tách ba chiều (tức là, [L|X|H][L|X|H][L|X|H] trừ XXX).

Các độ lợi băng con được chỉ rõ trong Bảng E.1 dưới đây thay cho Bảng E.1 của ISO/IEC 15444-1.

Bảng E.1 – Độ lợi băng con

Loại băng con	Độ lợi_b	log₂(độ lợi_b)
LLL, LXX, XLX, XXL, LXL, LLX, XLL	1	0
H[L\|X][L\|X], [L\|X]H[L\|X], [L\|X][L\|X]H	2	1
HH[L\|X], H[L\|X]H, [L\|X]HH	4	2
HHH	8	3

Đối với các cấu trúc phân tách ba chiều như đã được xác định trong tiêu chuẩn này, giá trị n_b trong Công thức E-5 của ISO/IEC 15444-1 biểu thị số lượng mức phân tách lớn nhất trong mỗi hướng không gian từ khối ảnh-thành phần ban đầu đến băng con b (tức là, n_b = max(nx_b, ny_b, nz_b), với nx_b, ny_b và nz_b được xác định bởi Công thức B-13).

Phụ lục F

(Quy định)

Mã hóa ảnh theo vùng quan tâm, phần mở rộng

F.1 Giới thiệu

Trong phụ lục này và các điều nhỏ của phụ lục, các lưu đồ và bảng chỉ có tính bắt buộc khi chúng chỉ rõ đầu ra mà các triển khai khác phải tuân thủ. Phụ lục này mô tả phần mở rộng khối của mã hóa theo vùng quan tâm cho cả Phụ lục H của ISO/IEC 15444-1 và Phụ lục L của T.801 | ISO/IEC 15444-2.

Phụ lục này mô tả công nghệ vùng quan tâm (ROI) ba chiều. ROI là một phần của ảnh và được mã hóa với độ trung thực cao hơn phần còn lại của ảnh (ảnh nền). Sự mã hóa cũng được thực hiện theo cách thức sao cho thông tin liên quan đến ROI sẽ đến trước thông tin liên quan đến ảnh nền.

F.2 Giải mã ROI

Các thủ tục được chỉ rõ trong điều này được áp dụng chỉ trong trường hợp có mặt đoạn nhãn RGN (xem A.2.4), tức là thể hiện sự có mặt của ROI được mã hóa bằng phương pháp dựa trên Maxshift hoặc Scaling.

F.2.1 Giải mã ROI bằng phương pháp Maxshift

Thủ tục này tổ chức lại các bit có trọng số của các hệ số ROI và các hệ số ảnh nền. Thủ tục thực hiện theo các bước sau:

1) Nhận giá trị phân cấp, s, từ tham số SPrgn của đoạn nhãn RGN trong dòng mã (xem A.2.4). Các bước tiếp theo (2, 3 và 4) được áp dụng cho từng hệ số của băng con b.

2) Nếu N_b(u,v,w) < M_b (xem các định nghĩa của N_b trong D.2.1 của ISO/IEC 15444-1 và M_b trong Công thức E-2 của ISO/IEC 15444-1), thì sẽ không có sửa đổi nào được thực hiện.

3) Nếu N_b(u,v,w) ≥ M_b và nếu ít nhất có một trong số M_b MSB đầu tiên (i = 1,…, M_b) khác không, thì giá trị của N_b(u,v,w) được cập nhật thành N_b(u,v,w) = M_b.

4) Nếu N_b(u,v,w) ≥ M_b và nếu tất cả M_b MSB đầu tiên bằng 0, thì thực hiện các sửa đổi sau:

i) loại bỏ s MSB đầu tiên và dịch các MSB còn lại thêm s vị trí, như được mô tả trong Công thức F-1, với i = 1,…, M_b

(F-1)

ii) cập nhật giá trị của N_b(u,v,w) như cho bởi công thức sau:

N_b(u,v,w) = max(o,N_b(u.v.w) – s) (F-2)

F.2.2 Giải mã ROI bằng phương pháp Scaling

Thủ tục này tổ chức lại các bit trọng số của các hệ số ROI và các hệ số ảnh nền. Thủ tục này thực hiện theo các bước sau:

1) Nhận thông tin kiểu tương ứng và giá trị phân cấp, s, từ đoạn nhãn RGN cho từng ROI. Sau đó, các bước từ 2 đến 6 được áp dụng cho từng hệ số (u,v,w) của băng con b.

2) Tạo mặt nạ ROI {M_i(u,v,w)} cho tất cả ROI, xem F.4.2 để có thông tin chi tiết về cách tạo mặt nạ ROI.

3) Đối với mỗi khối mã, tìm giá trị phân cấp lớn nhất s_max cho từng hệ số (u,v,w).

4) Đối với mỗi hệ số trong từng khối mã, tìm giá trị phân cấp cao nhất và đặt s(u,v,w) là:

s(u,v,w) = s_max – max(s_i – M_i (u,v,w)) (F-3)

Với i = 0…(số lượng ROI -1).

5) Đối với mỗi hệ số (u,v,w), loại bỏ s(u,v,w) MSB đầu tiên và dịch các MSB còn lại thêm s(u,v,w) vị trí, như được mô tả trong Công thức F-4, với i = 1,…, M_b:

(F-4)

6) Cập nhật giá trị của N_b(u,v,w) như cho trong Công thức F-5:

N_b(u,v,w) = max(0,N_b (u.v.w) – s(u,v,w)) (F-5)

F.3 Mã hóa ROI (tham khảo)

Điều này mô tả cách thức mã hóa ảnh có một hoặc nhiều ROI bằng phương pháp dựa trên Maxshift hoặc Scaling. Mã hóa được mô tả ở đây chỉ là thông tin tham khảo. Ở phía bộ mã hóa, mặt nạ ROI được tạo ra thể hiện các hệ số biến đổi lượng tử hóa phải được mã hóa với chất lượng tốt nhất (gần như không tổn thất). Mặt nạ ROI là một bản đồ bit mô tả các hệ số này.

F.3.1 Mô tả phương pháp Maxshift (tham khảo)

Các hệ số biến đổi được lượng tử nằm ngoài mặt nạ ROI, được gọi là các hệ số ảnh nền, được phân cấp giảm dần sao cho các bit liên quan đến ROI đều được đặt trong các mặt phẳng bit cao hơn so với ảnh nền. Điều này nghĩa là khi bộ mã hóa và giải mã entropy mã hóa các hệ số biến đổi được lượng tử thì các mặt phẳng bit liên quan đến ROI sẽ được mã hóa trước thông tin liên quan đến ảnh nền. Xem F.4.1 về tạo mặt nạ ROI bằng phương pháp Maxshift.

Phương pháp Maxshift có thể còn được mô tả bằng các bước sau:

1) Tạo mặt nạ ROI, M(x, y, z), xem F.4.1.

2) Tìm giá trị phân cấp s (xem F.3.2).

3) Cộng s LSB vào mỗi hệ số |q_b(u,v,w)|. Số lượng mặt phẳng bit biên độ M^’_b khi đó sẽ là:

M^’_b = M_b + s (F-6)

Với M_b được cho bởi Công thức E-2 của ISO/IEC 15444-1 và giá trị mới của mỗi hệ số sẽ được cho bởi:

│q_b(u,v,w)│ = │q_b(u,v,w)│. 2^S(F-7)

4) Giảm tất cả các hệ số ảnh nền được cho bởi M(x,y,z) sử dụng giá trị phân cấp s (xem F.3.2). Do đó, nếu │q_b(u,v,w)│ là hệ số ảnh nền được cho bởi M(x, y, z), thì:

(F-8)

5) Viết giá trị phân cấp s vào dòng mã sử dụng tham số SPrgn của đoạn nhãn RGN.

Sau các bước này thì các hệ số biến đổi được lượng tử đã được mã hóa entropy như bình thường.

F.3.2 Lựa chọn giá trị phân cấp, s, cho phương pháp Maxshift tại phía bộ mã hóa (tham khảo)

Giá trị phân cấp, s, có thể được lựa chọn sao cho Công thức F-9 đúng với đối với mọi hệ số hình nền, qBG(x,y,z), ở mọi khối mã trong thành phần hiện tại, với max(M_b) là số lượng mặt phẳng bit biên độ lớn nhất (xem Công thức E-1 của ISO/IEC 15444-1).

s ≥ max(M_b) (F-9)

Điều này đảm bảo rằng giá trị phân cấp được sử dụng sẽ đủ lớn để đảm bảo rằng tất cả các bit có trọng số liên quan đến ROI sẽ nằm trong mặt phẳng bit cao hơn so với tất cả các bit có trọng số liên quan đến ảnh nền.

F.3.3 Mô tả phương pháp dựa trên Scaling (tham khảo)

Như đã đề cập trong phần giới thiệu của F.3, phần mô tả mã hóa ROI chỉ có tính chất tham khảo. Tuy nhiên, khi sử dụng phương pháp ROI dựa trên Scaling, sự thất bại trong việc tạo mặt nạ ROI chính xác ở phía bộ mã hóa sẽ làm giảm đáng kể chất lượng ảnh được mã hóa và sẽ gây tổn thất khi giải mã. Xem F.4.2 về việc tạo mặt nạ ROI bằng phương pháp dựa trên Scaling.

Các hệ số biến đổi được lượng tử sẽ được phân cấp theo cách thức sao cho trọng số tương đối của mỗi hệ số biến đổi bằng với giá trị một phân cấp nhất định, s, của ROI mà chúng được áp dụng. Nếu một hệ số biến đổi lại thuộc một vài ROI thì giá trị s lớn nhất sẽ được lựa chọn. Nếu một hệ số biến đổi thuộc ảnh nền thì giá trị phân cấp s bằng 0. Trước khi phân cấp các hệ số biến đổi được lượng tử hóa của một khối mã thì phải tìm giá trị phân cấp lớn nhất S_Max và nhỏ nhất s_Min đối với khối mã.

Xét hệ số biến đổi được lượng tử, q_b(u,v,w), trong khối mã hiện tại có giá trị phân cấp tương ứng, s, (với s_Min < s ≤ s_Max). Sau khi phân cấp, các bit riêng lẻ của q_b(u,v,w) kết thúc abs(s_Max – s) mặt phẳng bit thấp hơn các bit tương ứng của hệ số có s = s_Max. Số lượng bit biên độ cho khối mã này do đó sẽ tăng thêm (s_Max – s_Min).

Do các khối mã được xử lý độc lập nên các hệ số biến đổi được lượng tử thuộc về cùng một ROI có thể kết thúc mà có các mức trọng số khác nhau trong các khối mã khác nhau. Sự chênh lệch này giữa các khối mã phải được cân nhắc bởi bộ phân bổ tốc độ. Một ví dụ về việc này là nếu toàn bộ một khối mã thuộc ảnh nền và một khối mã khác lại có cả các hệ số ROI và ảnh nền. Trong trường hợp này, các hệ số ảnh nền trong khối mã thứ hai phải được dịch lại s₀ bước, còn trong khối mã thứ nhất không phải dịch. Khi đó, thuật toán phân bổ tốc độ sẽ quyết định việc đảm bảo rằng các mặt phẳng bit từ hai khối mã đều được đưa vào dòng bit theo thứ tự đúng.

Khi bộ mã hóa và giải mã entropy mã hóa các hệ số biến đổi được lượng tử thì các mặt phẳng bit liên quan đến ROI sẽ được mã hóa trước hoặc cùng thời điểm với thông tin liên quan đến ảnh nền. Giá trị phân cấp, s_i, cho mỗi ROI được quy định bởi người dùng hoặc ứng dụng.

Phương pháp này có thể được mô tả bằng các bước sau cho tập gồm n ROI:

– Với mỗi khối mã trong mỗi thành phần:

1) Tạo mặt nạ ROI cho toàn bộ ROI i, {Mi(u,v,w)}, xem F.4.2.

2) Tìm s_Min and s_Max, với s_Min và s_Max tương ứng là các giá trị phân cấp nhỏ nhất và lớn nhất trong khối mã hiện tại.

3) Cộng s_Block = s_Max – s_Min LSB vào mỗi hệ số |q_b(u,v,w)|. Số lượng mặt phẳng bit biên độ M^’_b đối với băng b khi đó sẽ là:

M^’_b = M_b + s_Block(F-10)

với M_b được cho bởi Công thức E-2 của ISO/IEC 15444-1 và giá trị mới của mỗi hệ số sẽ được cho bởi:

(F-11)

4) Đối với mỗi hệ số trong từng khối mã, tìm giá trị phân cấp cao nhất và đặt s(u,v,w) thành:

s(u,v,w) = s_max – max(s_i – M_i(u,v,w)) (F-12)

với i = 0 … (số lượng ROI – 1).

5) Giảm dần tất cả các hệ số sao cho:

(F-13)

6) Đối với mỗi ROI, viết giá trị phân cấp s, kiểu, và các điểm tham chiếu vào dòng mã sử dụng đoạn nhãn RGN như được mô tả trong A.2.4.

F.4 Tạo mặt nạ vùng quan tâm

Để có được một ROI có chất lượng tốt hơn so với phần còn lại của ảnh mà vẫn duy trì được độ nén phù hợp thì các bít cần được tiết kiệm bằng cách gửi ít thông tin về ảnh nền. Để làm việc này thì mặt nạ ROI sẽ được tính toán. Mặt nạ này là một mặt phẳng bit chỉ ra một tập các hệ số biến đổi được lượng tử mà sự mã hóa chúng là đủ cho bộ thu phục dựng vùng mong muốn với chất lượng tốt hơn so với ảnh nền (gần như không tổn thất).

Để thể hiện khái niệm về việc tạo mặt nạ ROI, xét một ROI đơn và một thành phần khối đơn, và xác định các mẫu thuộc ROI đó trong miền khối cho bởi mặt nạ nhị phân, M(x, y, z), với:

	hệ số sóng con (x,y,z) được yêu cầu	(F-14)
	độ chính xác trên (x,y,z) có thể thoải mãn mà không ảnh hưởng đến ROI

Mặt nạ là bản đồ của ROI trong miền sóng con sao cho chúng có giá trị khác 0 trong ROI và bằng 0 ngoài ROI. Trong mỗi bước, mỗi băng con của mặt nạ khi đó sẽ được cập nhật theo thứ tự quét mành. Mặt nạ khi đó sẽ chỉ ra các hệ số nào được yêu cầu tại bước này sao cho sự biến đổi nghịch sẽ cho lại các hệ số của mặt nạ trước đó.

Ví dụ, bước cuối cùng của biến đổi nghịch là bước hợp nhất hai băng con thành một. Để đến được bước này thì phải tìm được các hệ số của cả hai băng con. Bước trước đó là bước hợp nhất bốn băng con thành hai băng. Để đến được bước này thì phải tìm được các hệ số trong bốn băng con cần để phục dựng các hệ số có trong mặt nạ của hai băng con đó một cách hoàn hảo. Cũng như vậy, bước trước đó là bước hợp nhất tám băng con thành bốn băng con. Lại một lần nữa, để đến được bước này thì phải tìm được các hệ số trong tám băng con cần cho tất cả bốn băng con này.

Tất cả các bước sau đó đều được thực hiện ngược lại để cho ra mặt nạ. Nếu các hệ số tương ứng với mặt nạ được phát đi và thu lại, và sự biến đổi nghịch đã được tính toán trên các hệ số này thì ROI mong muốn sẽ được phục dựng với chất lượng tốt hơn so với phần còn lại của khối (gần như không tổn thất nếu các hệ số ROI đều được mã hóa không tổn thất).

F.4.1 Tạo mặt nạ vùng quan tâm cho phương pháp Maxshift (tham khảo)

Phần dưới đây mô tả cách thức mở rộng mặt nạ bằng các bộ lọc khác nhau. Các phương pháp tương tự có thể được sử dụng đối với các bộ lọc khác.

F.4.1.1 Tạo mặt nạ vùng quan tâm bằng bộ lọc thuận nghịch 5-3 (tham khảo)

Để có được một tập tối ưu các tham số được lượng tử để tiến hành phân cấp thì cần sử dụng các công thức đã được mô tả trong điều này.

Biến đổi sóng con nghịch đã được sử dụng để tìm ra các hệ số cần có trong mặt nạ. Công thức F-5 và F-6 của ISO/IEC 15444-1 cho các hệ số cần để phục dựng X(2n) và X(2n + 1) mà không tổn thất. Có thể thấy ngay rằng đó là L(n), L(n + 1), H(n – 1), H(n), H(n + 1) (xem Hình H.1 của ISO/IEC 15444-1). Do vậy, nếu X(2n) và X(2n + 1) nằm trong ROI thì các hệ số băng con thấp và cao ở trên đều có trong mặt nạ. Lưu ý rằng X(2n) và X(2n +1) tương ứng là các điểm có chỉ số chẵn và lẻ, liên quan đến gốc lưới tọa độ tham chiếu.

F.4.1.2 Tạo mặt nạ vùng quan tâm bằng bộ lọc không thuận nghịch 9-7 (tham khảo)

Sự giải mã thành công không phụ thuộc vào việc lựa chọn các mẫu để tiến hành phân cấp. Để có được tập tối ưu các hệ số được lượng tử để tiến hành phân cấp thì cần sử dụng các công thức đã được mô tả trong điều này.

Để tìm được các hệ số cần có trong mặt nạ thì biến đổi sóng con nghịch đã được sử dụng như trong H.3.1.1 của ISO/IEC 15444-1. Điều này đã được mô tả trong Hình H.2. X(2n) và X(2n + 1) tương ứng là các điểm có chỉ số chẵn và lẻ, liên quan đến gốc lưới tọa độ tham chiếu.

Có thể thấy ngay rằng, các hệ số cần để phục dựng X(2n) và X(2n + 1) mà không tổn thất là L(n – 1) đến L(n + 2) và H(n – 2) đến H(n + 2). Do đó, nếu X(2n) và X(2n + 1) đều nằm trong ROI thì các hệ số băng con thấp và cao này đều nằm trong mặt nạ.

F.4.2 Tạo mặt nạ vùng quan tâm bằng phương pháp dựa trên Scaling

Dưới đây là những mô tả về cách thức mở rộng mặt nạ cho trường hợp hình khối và hình Elipxoit và cách thức thực hiện với các bộ lọc khác nhau. Các phương pháp tương tự có thể được sử dụng đối với các bộ lọc khác.

F.4.2.1 Tạo mặt nạ hình khối trên lưới tọa độ tham chiếu

Mặt nạ hình khối được mô tả trong điều này được tạo trên lưới tọa độ tham chiếu. Khi được tạo trên lưới tọa độ tham chiếu, phương pháp được mô tả trong F.4.2.3 được sử dụng để tạo mặt nạ trong miền sóng con. Một hình khối được mô tả bởi sáu tham số, xem Hình F.1, tất cả đều được báo hiệu trong nhãn RGN (xem A.2.4). Các tham số gồm (XArgn, YArgn, ZArgn, XBrgn, YBrgn, ZBrgn), với XArgn, YArgn và ZArgn là độ lệch x, y và z của góc trên bên trái mặt trước của hình khối từ gốc lưới tọa độ tham chiếu, trong đó XBrgn, YBrgn và ZBrgn tương ứng là chiều rộng, chiều cao và chiều sâu của hình khối.

Mặt nạ đúng của lưới tọa độ tham chiếu được cho bởi Công thức F-15.

XArgn ≤ x ≤ XArgn + XBrgn

YArgn ≤ y ≤ YArgn + YBrgn

ZArgn ≤ z ≤ ZArgn + ZBrgn

(F-15)

Hình F.1 – Mặt nạ hình khối trên lưới tọa độ tham chiếu

F.4.2.2 Tạo mặt nạ Elipxoit trên lưới tọa độ tham chiếu

Mặt nạ Elipxoit mô tả trong phần này được tạo trên lưới tọa độ tham chiếu. Khi được tạo trên lưới tọa độ tham chiếu, phương pháp được mô tả trong F.4.2.3 được sử dụng để tạo mặt nạ trong miền sóng con. Hình Elipxoit được mô tả bởi sáu tham số, xem Hình F.2, tất cả các tham số đều được báo hiệu trong nhãn RGN (xem A.2.4). Các tham số gồm (XArgn, YArgn, ZArgn, XBrgn, YBrgn, ZBrgn), với XArgn, YArgn và ZArgn là độ lệch x, y và z của tâm hình Elipxoit từ gốc lưới tọa độ tham chiếu, trong đó XBrgn, YBrgn và ZBrgn tương ứng là chiều rộng, chiều cao và chiều sâu của hình Elipxoit.

Mặt nạ đúng của lưới tọa độ tham chiếu được cho bởi Công thức F-16.

(F-16)

Hình F.2 – Mặt nạ Elipxoit trên lưới toạn độ tham chiếu

F.4.2.3 Tạo nhanh mặt nạ hình khối (tham khảo)

Trong trường hợp ROI hình khối thì mặt nạ có thể được tạo nhanh hơn so với các kiểu nhị phân. Trong trường hợp này, thay vì phải tìm ra cách thức phục dựng từng hệ số và giá trị voxel theo biến đổi nghịch thì chỉ cần xem xét hai vị trí, đó là góc trên bên trái mặt trước và góc dưới bên phải mặt sau của mặt nạ. Góc trước bên trái cao nhất (x₁,y₁,z₁) trên lưới tọa độ tham chiếu sẽ được cho trong đoạn nhãn RGN là (XArgn, YArgn, ZArgn), trong đó góc sau bên phải thấp nhất (x₂,y₂,z₂) trên lưới tọa độ tham chiếu sẽ được cho bởi các tham số trong đoạn nhãn RGN là (XArgn + XBrgn – 1), (YArgn + YBrgn – 1), (ZArgn + ZBrgn – 1).

Việc tạo mặt nạ cũng phải xem xét xem loại bộ lọc nào đã được sử dụng cho biến đổi.

Trong mỗi mức phân tách, các bước được mô tả ở phần trước được thực hiện để xem mặt nạ được mở rộng như thế nào. Xét một mặt nạ 1D cần được phân tách, R_ext, và đặt x₁ và x₂ là các chỉ số thấp nhất và cao nhất của các mẫu khác 0 trong R_ext.

1) Với mỗi bước nâng s với s trong dải từ 0 đến N_LS – 1:

i) Tìm chỉ số mẫu thấp nhất (2n +m_s ≥ x₁) nằm trong mặt nạ

(F-17)

nếu (x^’₁ > x₁) thì x^’₁ = x₁(F-18)

ii) Tìm chỉ số mẫu cao nhất (2n + m_s ≤ x₂)

(F-19)

nếu (x^’₂ > x₂) thì x^’₂ = x₂ (F-20)

iii) Đặt x₁ = x^’₁, x₂= x’₂ với m_s = 1 – m_s_-1 chỉ ra rằng bước nâng thứ s áp dụng cho các hệ số có chỉ số chẵn (m_s = 0) hay cho các hệ số có chỉ số lẻ (m_s = 1), và với L_s là số lượng hệ số nâng cho bước nâng s.

Đặt tất cả các mẫu giữa x₁ và x₂, kể cả tại x₁ và x₂, là khác 0 và sau đó sử dụng thủ tục giải chèn được mô tả trong F.4.5 của ISO/IEC 15444-1 để phân chia các mẫu mặt nạ ROI thành các băng con theo cách các hệ số sóng con được phân chia.

F.5 Các lưu ý về mã hóa vùng quan tâm

F.5.1 Cách sử dụng các phương pháp Scaling và Maxshift

Không được sử dụng phương pháp Maxshift cùng với phương pháp dựa trên Scaling và ngược lại.

F.5.2 Lưu ý về đa thành phần (tham khảo)

Đối với trường hợp các ảnh màu thì áp dụng phương pháp này riêng cho từng thành phần màu. Nếu một vài thành phần màu bị giảm kích thước thì mặt nạ cho các thành phần giảm kích thước sẽ được thiết lập theo như cách với mặt nạ của các thành phần không bị giảm kích thước.

F.5.3 Lưu ý về độ chính xác trong triển khai (tham khảo)

Trong một vài trường hợp, phương pháp mã hóa ROI này có thể làm vượt quá dải động. Tuy nhiên, vấn đề này dễ dàng được giải quyết bằng cách đơn giản là loại bỏ bớt các mặt phẳng bit có ý nghĩa thấp nhất hiện đang vượt quá giới hạn do quá trình giảm kích thước. Tác động của việc này sẽ làm ROI có chất lượng tốt hơn so với ảnh nền, cho dù là toàn bộ dòng bit đã được giải mã. Tuy nhiên, điều này có thể lại gây nên các vấn đề nếu ảnh được mã hóa với ROI theo kiểu không tổn thất. Việc loại bỏ các mặt phẳng bit có ý nghĩa thấp nhất đối với ảnh nền có thể lại làm cho ảnh nền không được mã hóa không tổn thất, và trường hợp tồi nhất là ảnh nền có thể không hề được phục dựng. Điều này sẽ tùy thuộc vào dải động.

Phụ lục G

(Tham khảo)

Các ví dụ và hướng dẫn, phần mở rộng

G.1 Mô hình hóa tốc độ méo

Xem J.14 của ISO/IEC 15444-1.

Thư mục tài liệu tham khảo

[1] Morton, G.M. (1966), A Computer Oriented Geodetic Data Base and a New Technique in File Sequencing, IBM Ltd, Ottawa, Canada.

[2] Taubman, D., Marcellin, M.W. (2001), JPEG2000- Image Compression: Fundamentals, Standards and Practice, Hingham, MA: Kluwer Academic Publishers.

[3] Schelkens, P. (2001), Multidimensional wavelet coding- algorithms and implementations, PhD Thesis, Department of Electronics and Information Processing (ETRO), Vrije Universiteit Brussel, Brussel.

[4] Schelkens, P., Munteanu, A., Barbarien, J., Galca, M., Giro i Nieto, X., and Cornelis, J. (2003), Wavelet Coding of Volumetric Medical Datasets, IEEE Transactions on Medical Imaging, Vol. 22, pp. 441-458.

[5] Schelkens, P., Skodras, A., Ebrahimi, T., et al. (2009), The JPEG 2000 Suite, John Wiley & Sons, Ltd.

MỤC LỤC

1 Phạm vi áp dụng

2 Tài liệu viện dẫn

3 Thuật ngữ và định nghĩa

4 Thuật ngữ viết tắt

5 Ký hiệu (và thuật ngữ viết tắt)

6 Mô tả chung

Phụ lục A (Quy định) Cú pháp dòng mã, phần mở rộng

Phụ lục B (Quy định) Ảnh và xếp thứ tự dữ liệu ảnh nén, phần mở rộng

Phụ lục C (Quy định) Mô hình hóa bit hệ số

Phụ lục D (Quy định) Biến đổi sóng con rời rạc của các khối ảnh – thành phần

Phụ lục E (Quy định) Lượng tử hóa

Phụ lục F (Quy định) Mã hóa ảnh theo vùng quan tâm, phần mở rộng

Phụ lục G (Tham khảo) Các ví dụ và hướng dẫn, phần mở rộng

Thư mục tài liệu tham khảo

TIÊU CHUẨN QUỐC GIA TCVN 11777-10:2017 (ISO/IEC 15444-10:2011) VỀ CÔNG NGHỆ THÔNG TIN – HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG 2000 – PHẦN MỞ RỘNG ĐỐI VỚI DỮ LIỆU BA CHIỀU
Số, ký hiệu văn bản	TCVN11777-10:2017	Ngày hiệu lực
Loại văn bản	Tiêu chuẩn Việt Nam	Ngày đăng công báo
Lĩnh vực	Giao dịch điện tử	Ngày ban hành	01/01/2017
Cơ quan ban hành		Tình trạng	Còn hiệu lực

Các văn bản liên kết

Văn bản được hướng dẫn		Văn bản hướng dẫn
Văn bản được hợp nhất		Văn bản hợp nhất
Văn bản bị sửa đổi, bổ sung		Văn bản sửa đổi, bổ sung
Văn bản bị đính chính		Văn bản đính chính
Văn bản bị thay thế		Văn bản thay thế
Văn bản được dẫn chiếu		Văn bản căn cứ

Tải văn bản

Tải văn bản về Bản PDF/Bản gốc