TIÊU CHUẨN QUỐC GIA TCVN 11777-10:2017 (ISO/IEC 15444-10:2011) VỀ CÔNG NGHỆ THÔNG TIN – HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG 2000 – PHẦN MỞ RỘNG ĐỐI VỚI DỮ LIỆU BA CHIỀU
TCVN 11777-10:2017
ISO/IEC 15444-10:2011
CÔNG NGHỆ THÔNG TIN – HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG 2000 – PHẦN MỞ RỘNG ĐỐI VỚI DỮ LIỆU BA CHIỀU
Information technology – JPEG 2000 image coding system: Extensions for three-dimensional data
Lời nói đầu
TCVN 11777-10:2017 hoàn toàn tương đương với ISO/IEC 15444-10:2011.
TCVN 11777-10:2017 do Học viện Công nghệ Bưu chính Viễn thông biên soạn, Bộ Thông tin và Truyền thông đề nghị, Tổng cục Tiêu chuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ công bố.
CÔNG NGHỆ THÔNG TIN – HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG 2000 – PHẦN MỞ RỘNG ĐỐI VỚI DỮ LIỆU BA CHIỀU
Information technology – JPEG 2000 image coding system – Extensions for three-dimensional data
1 Phạm vi áp dụng
Tiêu chuẩn này cung cấp phần mở rộng cho hệ thống mã hóa lõi (ISO/IEC 15444-1) và phần mở rộng (ISO/IEC 15444-2) đối với các tập dữ liệu dạng khối logic. Cụ thể là, tiêu chuẩn vẫn duy trì tất cả các tính năng hiện tại và cú pháp của ISO/IEC 15444-1, và một phần tính năng hiện tại của ISO/IEC15444-2 đối với các ảnh đa thành phần, bên cạnh đó cung cấp các tùy chọn và mở rộng cho một số các tính năng này. Trong các nội dung này, tiêu chuẩn đưa ra đặc tả đẳng hướng cho các tập dữ liệu ba chiều, tức là, đưa ra các tính năng xử lý đồng nhất ở tất cả ba chiều thậm chí cả khi cú pháp dòng mã của ISO/IEC 15444-1 và ISO/IEC 15444-2 khác nhau giữa hai trục không gian và trục thành phần chéo. Các mô hình ngữ cảnh được sử dụng trong tiêu chuẩn này giống các mô hình ngữ cảnh trong ISO/IEC 15444-1 và ISO/IEC 15444-2. Các mô hình ngữ cảnh cải tiến sẽ được giới thiệu trong tài liệu bổ sung.
2 Tài liệu viện dẫn
Các tài liệu viện dẫn sau đây là cần thiết để áp dụng tiêu chuẩn này. Đối với các tài liệu viện dẫn ghi năm công bố thì áp dụng phiên bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất (bao gồm cả các sửa đổi, bổ sung).
ISO/IEC 15444-1:2004, Công nghệ thông tin – Hệ thống mã hóa hình ảnh JPEG 2000: Hệ thống mã hóa lõi (Information technology – JPEG 2000 image coding system: Core coding system).
ISO/IEC 15444-2:2004, Công nghệ thông tin – Hệ thống mã hóa hình ảnh JPEG 2000: Phần mở rộng. (Information technology- JPEG 2000 image coding system: Extensions).
3 Thuật ngữ và định nghĩa
Tiêu chuẩn này sử dụng các thuật ngữ và định nghĩa sau:
3.1
Khối bit 3D (3D bit-block)
Mảng ba chiều của các bit. Trong tiêu chuẩn này, khối bit 3D nói đến tất cả các bit có cùng biên độ ở mọi hệ số hoặc mẫu. Thuật ngữ này có thể nói đến khối bit 3D trong thành phần, khối ảnh-thành phần, khối mã 3D, vùng quan tâm, hoặc các đối tượng khác.
3.2
Khối mã 3D (3D code-block)
Nhóm ba chiều dạng khối chữ nhật của các hệ số từ cùng một băng con của khối ảnh-thành phần.
3.3
Quét khối mã 3D (3D code-block scan)
Thứ tự các hệ số khối mã 3D được truy cập trong quá trình mã hóa. Khối mã 3D được xử lý theo sọc, mỗi sọc gồm bốn hàng (hoặc tất cả các hàng còn lại nếu ít hơn bốn hàng) và trải theo chiều rộng của khối mã 3D. Mỗi sọc được xử lý theo từng cột tính từ cột cao nhất tới thấp nhất và từ trái sang phải. Do vậy, toàn bộ khối mã 3D được quét theo từng lát ảnh. Trong mỗi lát ảnh lại tuân thủ theo ISO/IEC 15444-1.
3.4
Thành phần (component)
Dữ liệu nén từ dòng mã có dạng một tập đơn gồm dữ liệu hai hoặc ba chiều.
3.5
Thiết bị đọc phù hợp (conforming reader)
Ứng dụng dùng để đọc và biên dịch tập tin JP3D một cách chính xác.
3.6
Mức phân tách (decomposition level)
Tập hợp các băng con nơi mà mỗi hệ số đều có cùng tác động theo không gian hoặc trải theo các mẫu gốc. Các băng con này gồm băng con [H|L|X][H|L|X][H|L|X] (ví dụ, LLL, LXL, XXH, …, trừ XXX) được chia theo các mức con phân tách ba chiều.
3.7
Băng con [H|L|X][H|L|X][H|L|X] [H|L|X][H|L|X][H|L|X] (sub-band [H|L|X][H|L|X][H|L|X] [H|L|X][H|L|X][H|L|X])
H nghĩa là lọc thông cao, L nghĩa là lọc thông thấp, X nghĩa là không lọc. Bộ lọc đầu tiên là lọc theo chiều ngang, bộ lọc thứ hai là lọc theo chiều dọc và bộ lọc thứ ba là lọc theo trục (tức là, tương ứng theo các trục X, Y và Z). Việc lập thứ tự lọc cho băng con này phải luôn được lưu ý. Việc phục dựng sẽ thực hiện theo thứ tự lọc đảo ngược.
CHÚ THÍCH: Ở đây không bao gồm băng con XXX (như định nghĩa trong 3.6).
3.8
Ảnh (image)
Tập tất cả các thành phần hai hoặc ba chiều.
3.9
Độ lệch vùng ảnh (image area offset)
Số lượng điểm lưới tọa độ tham chiếu nằm dưới, ở bên phải (và ở một vị trí dọc trục trên) của gốc lưới tọa độ tham chiếu.
3.10
Thành phần trung gian (intermediate component)
Mảng dữ liệu đơn hai hoặc ba chiều tham gia vào giai đoạn biến đổi đa thành phần.
3.11
Thứ tự quét mành (raster order)
Thứ tự riêng theo dãy của dữ liệu có dạng bất kỳ trong mảng. Thứ tự quét mành bắt đầu tại điểm dữ liệu cao nhất bên trái của lát ảnh đầu tiên và chuyển đến điểm dữ liệu ngay bên phải, và tiếp tục như vậy đến cuối hàng. Sau khi đã đến cuối hàng, điểm dữ liệu tiếp theo trong dãy là điểm dữ liệu gần nhất bên trái ngay dưới hàng hiện tại. Thứ tự này cứ tiếp tục như vậy đến cuối của lát ảnh. Sau đó, lát ảnh tiếp theo sẽ được xử lý theo dạng mảng ba chiều. Thứ tự như vậy được tiếp tục đến cuối mảng.
3.12
Phân giải (resolution)
Mối quan hệ không gian của các mẫu theo không gian vật lý. Trong tiêu chuẩn này, các mức phân tách của biến đổi sóng con sẽ tạo nên các phân giải chênh lệch theo lũy thừa hai ở chiều ngang, chiều dọc, hoặc trong trường hợp ba chiều là hướng trục, hoặc mọi sự kết hợp có thể của các hướng. Mức phân tách cuối cùng (cao nhất) gồm một băng con [L|X][L|X][L|X] (lưu ý là không bao gồm XXX), được coi là phân giải thấp hơn. Do vậy, sẽ có hơn một mức phân giải so với số mức phân tách.
3.13
Mức phân giải (resolution level)
Tương đương với mức phân tách, ngoại trừ rằng băng con [L|X][L|X][L|X] cũng là một mức phân giải riêng.
3.14
Mẫu (sample)
Một phần tử trong mảng hai hoặc ba chiều có chứa một thành phần.
3.15
Lát ảnh (slice)
Lát ảnh là một tập hợp con ảnh điểm hai chiều của một thực thể lập thể, khối mã lập thể hoặc ảnh lập thể. Lát ảnh có vị trí trực giao với trục hoặc trục z.
3.16
Hệ tọa độ không gian (spatial coordinates)
Hệ tọa độ không gian được biểu thị bởi các trục x, y và z. Nói chung, thuật ngữ trục sẽ được sử dụng để chỉ chiều Z.
3.17
Băng con (sub-band)
Nhóm các hệ số biến đổi sinh ra từ cùng một chuỗi các quá trình lọc thông thấp và thông cao.
3.18
Bậc băng con (sub-band order)
Trong cùng mức phân giải, các băng con được xử lý và được báo hiệu như xác định trong ISO/IEC 15444-1 và ISO/IEC 15444-2 đối với lọc hai chiều, tuân theo thứ tự quét Morton [1]. Đặc tả được mở rộng cho trường hợp ba chiều trong trường hợp triển khai thứ tự quét Morton ba chiều.
3.19
Khối ảnh (tile)
Mảng hình khối của các điểm nằm trên lưới tọa độ tham chiếu, được biểu thị bằng một độ lệch so với gốc lưới tọa độ tham chiếu và được định nghĩa bởi chiều rộng (chiều x), chiều cao (chiều y) và chiều sâu (chiều z). Các khối ảnh xếp chồng được gọi là các khối ảnh-thành phần.
4 Thuật ngữ viết tắt
Tiêu chuẩn này sử dụng các thuật ngữ viết tắt nêu trong Điều 4 của ISO/IEC 15444-1 và Điều 4 của ISO/IEC 15444-2.
5 Ký hiệu (và thuật ngữ viết tắt)
Tiêu chuẩn này sử dụng các ký hiệu nêu trong Điều 4 của ISO/IEC 15444-1 và Điều 5 của ISO/IEC 15444-2.
6 Mô tả chung
Tiêu chuẩn này đưa ra các phương pháp nén không tổn thất (bảo toàn các bit) và nén có tổn thất để mã hóa các ảnh màu số lập thể có sắc độ liên tục, hai mức, theo thang màu xám hoặc các ảnh lập thể đa thành phần. Các phương pháp này (xem Phụ lục A) mở rộng các phần tử trong hệ thống mã hóa lõi được mô tả trong ISO/IEC 15444-1 và ISO/IEC 15444-2. Các mở rộng liên quan đến việc mã hóa và giải mã được xác định là các thủ tục có thể được sử dụng kết hợp với các quá trình mã hóa và giải mã được mô tả trong ISO/IEC 15444-1 và ISO/IEC 15444-2. Mỗi mở rộng mã hóa và giải mã sẽ chỉ được sử dụng kết hợp với các quá trình mã hóa nhất định và chỉ tuân thủ các yêu cầu được đưa ra ở đây. Tiêu chuẩn này cũng đưa ra các mở rộng về định dạng dữ liệu nén, tức là định dạng trao đổi và các định dạng rút gọn.
Cụ thể là, tiêu chuẩn này hỗ trợ các mở rộng sau đối với ISO/IEC 15444-2:
1) độ lệch DC biến thiên;
2) các nhân biến đổi sóng con tùy ý;
3) các biến đổi đa thành phần;
4) các biến đổi phi tuyến;
5) vùng quan tâm.
Phụ lục A
(Quy định)
Cú pháp dòng mã, phần mở rộng
A.1 Khả năng mở rộng
Cú pháp trong phụ lục này hỗ trợ các mở rộng trong tiêu chuẩn này. Các đoạn nhãn tuân thủ các quy tác về cú pháp trong Phụ lục A của ISO/IEC 15444-1. Phần bổ sung của các giá trị tham số đối với một số đoạn nhãn trong ISO/IEC 15444-1 và ISO/IEC 15444-2, và phần bổ sung của các đoạn nhãn mới sẽ đưa ra thông tin cụ thể cho các mở rộng trong tiêu chuẩn này.
Trong mọi đoạn nhãn, hai byte đầu tiên ngay sau nhãn phải là một giá trị không báo hiệu biểu thị chiều dài của các tham số đoạn nhãn theo byte (bao gồm cả hai byte tham số chiều dài nhưng không gồm hai byte nhãn).
Nếu một đoạn nhãn hiện chưa được chỉ rõ trong tiêu chuẩn này hoặc trong ISO/IEC 15444-1 và ISO/IEC 15444-2 lại xuất hiện trong một dòng mã thì bộ giải mã phải sử dụng tham số chiều dài để loại bỏ đoạn nhãn này. Bảng A.1 đưa ra cách thức sử dụng đoạn nhãn trong tiêu chuẩn này.
Bảng A.1 – Danh sách nhãn và đoạn nhãn
Ký hiệu |
Mã |
Tiêu đề chính |
Tiêu đề khối ảnh-bộ phận |
ISO/IEC 15444-x cũ/ mở rộng |
|
Phân định các nhãn và đoạn nhãn |
|
|
|
|
|
Bắt đầu dòng mã |
SOC |
0xFF4F |
yêu cầu |
không cho phép |
ISO/IEC 15444-1:2004 |
Bắt đầu khối ảnh-bộ phận |
SOT |
0XFF90 |
không cho phép |
yêu cầu |
ISO/IEC 15444-2:2004 |
Bắt đầu dữ liệu |
SOD |
0xFF93 |
không cho phép |
nhãn cuối cùng |
ISO/IEC 15444-1:2004 |
Kết thúc dòng mã |
EOC |
0xFFD9 |
không cho phép |
không cho phép |
ISO/IEC 15444-1:2004 |
Các đoạn nhãn thông tin cố định |
|
|
|
|
|
Kích thước ảnh và khối ảnh |
SIZ |
0xFF51 |
yêu cầu |
không cho phép |
ISO/IEC 15444-1:2004 |
Kích thước ảnh và khối ảnh chiều bổ sung |
NSI |
0xFF54 |
yêu cầu |
không cho phép |
|
Các khả năng mở rộng |
CAP |
0xFF50 |
yêu cầu |
không cho phép |
ISO/IEC 15444-2:2004/ Bổ sung.2:2006 |
Các đoạn nhãn chức năng |
|
|
|
|
|
Mặc định kiểu mã hóa |
COD |
0xFF52 |
yêu cầu |
tùy chọn |
ISO/IEC 15444-1:2004, mở rộng |
Thành phần kiểu mã hóa |
COC |
0xFF53 |
tùy chọn |
tùy chọn |
ISO/IEC 15444-1:2004, mở rộng |
Vùng quan tâm |
RGN |
0xFF5E |
tùy chọn |
tùy chọn |
ISO/IEC 15444-2:2004, mở rộng |
Mặc định lượng tử hóa |
QCD |
0xFF5C |
yêu cầu |
tùy chọn |
ISO/IEC 15444-1:2004, mở rộng |
Thành phần lượng tử hóa |
QCC |
0xFF5D |
tùy chọn |
tùy chọn |
ISO/IEC 15444-1:2004, mở rộng |
Các nhân biến đổi tùy ý |
ATK |
0xFF79 |
tùy chọn |
tùy chọn |
ISO/IEC 15444-2:2004 |
Định nghĩa chiều sâu bit thành phần |
CBD |
0xFF78 |
tùy chọn |
tùy chọn |
ISO/IEC 15444-2:2004 |
Định nghĩa biến đổi đa thành phần |
MCT |
0xFF74 |
tùy chọn |
tùy chọn |
ISO/IEC 15444-2:2004 |
Tập hợp biến đổi đa thành phần |
MCC |
0xFF75 |
tùy chọn |
tùy chọn |
ISO/IEC 15444-2:2004 |
Thứ tự biến đổi đa thành phần |
MCO |
0xFF77 |
tùy chọn |
tùy chọn |
ISO/IEC 15444-2:2004 |
Biến đổi điểm phi tuyến |
NLT |
0xFF76 |
tùy chọn |
tùy chọn |
ISO/IEC 15444-2:2004 |
Độ lệch DC biến thiên |
DCO |
0xFF70 |
tùy chọn |
tùy chọn |
ISO/IEC 15444-2:2004 |
Các đoạn nhãn con trỏ |
|
|
|
|
|
Các chiều dài khối ảnh-bộ phận |
TLM |
0xFF55 |
tùy chọn |
không cho phép |
ISO/IEC 15444-1:2004 |
Chiều dài gói tin, tiêu đề chính |
PLM |
0xFF57 |
tùy chọn |
không cho phép |
ISO/IEC 15444-1:2004 |
Chiều dài gói tin, tiêu đề khối ảnh-bộ phận |
PLT |
0xFF58 |
không cho phép |
tùy chọn |
ISO/IEC 15444-1:2004 |
Các tiêu đề gói tin đóng gói, tiêu đề chính |
PPM |
0xFF60 |
tùy chọn |
không cho phép |
ISO/IEC 15444-1:2004 |
Các tiêu đề gói tin đóng gói, tiêu đề khối ảnh-bộ phận |
PPT |
0xFF61 |
không cho phép |
tùy chọn |
ISO/IEC 15444-1:2004 |
Các nhãn và đoạn nhãn trong dòng bit |
|
|
|
|
|
Bắt đầu gói tin |
SOP |
0xFF91 |
không cho phép |
Không cho phép trong tiêu đề khối ảnh-bộ phận, tùy chọn trong dòng bit |
ISO/IEC 15444-1:2004 |
Kết thúc tiêu đề gói tin |
EPH |
0xFF92 |
Tùy chọn trong đoạn nhãn PPM |
Tùy chọn trong đoạn nhãn PPT hoặc trong dòng bit |
ISO/IEC 15444-1:2004 |
Các đoạn nhãn cung cấp thêm thông tin |
|
|
|
|
|
Đăng ký thành phần |
CRG |
0xFF63 |
tùy chọn |
không cho phép |
ISO/IEC 15444-1:2004, mở rộng |
Chú giải |
COM |
0xFF64 |
tùy chọn |
tùy chọn |
ISO/IEC 15444-1:2004 |
a) “Yêu cầu” nghĩa là nhãn hoặc đoạn nhãn phải nằm trong tiêu đề này, “tùy chọn” nghĩa là có thể được sử dụng. |
A.2 Các mở rộng đối với các tham số đoạn nhãn trong ISO/IEC 15444-1 và ISO/IEC 15444-2
A.2.1 Kích thước ảnh và khối ảnh chiều bổ sung (NSI)
Chức năng: | Cung cấp thông tin về ảnh chưa nén, ví dụ chiều sâu của lưới tọa độ tham chiếu, chiều sâu của các khối ảnh, và sự phân chia các mẫu thành phần theo lưới tọa độ tham chiếu. |
Cách sử dụng: | Tiêu đề chính. Phải có một và chỉ một NSI trong tiêu đề chính. |
Chiều dài: | Biến thiên tùy theo số lượng thành phần. |
Hình A.1 – Cú pháp kích thước ảnh và khối ảnh chiều bổ sung (mở rộng)
NSI: |
Mã nhãn. Bảng A.2 đưa ra các giá trị kích thước và tham số của ký hiệu và các tham số đối với đoạn nhãn kích thước ảnh và khối ảnh chiều bổ sung. |
Lnsi: |
Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bằng công thức sau:
Lnsi = 19 + Csiz (A-1) |
Ndim: |
Xác định tính chất chiều của tập dữ liệu (không xét đến chiều của thành phần). Giá trị này được đặt mặc định là 3. |
Zsiz: |
Chiều sâu của lưới tọa độ tham chiếu. |
ZOsiz: |
Độ lệch chiều sâu từ gốc lưới tọa độ tham chiếu đến góc trước bên trái phía trên của khối ảnh. |
ZTsiz: |
Chiều sâu của khối ảnh tham chiếu so với lưới tọa độ tham chiếu. |
ZTOsiz: |
Độ lệch dọc từ gốc lưới tọa độ tham chiếu đến góc trước bên trái phía trên của khối ảnh đầu tiên. |
ZRsizi: |
Phân chia chiều sâu của một mẫu của thành phần thứ i so với lưới tọa độ tham chiếu. Tham số này xuất hiện một lần đối với mỗi thành phần, và chúng xuất hiện theo thứ tự thành phần. |
Bảng A.2 – Các giá trị tham số kích thước ảnh và khối ảnh chiều bổ sung (mở rộng)
Tham số |
Kích thước (bit) |
Giá trị |
NSI |
16 |
0xFF54 |
Lnsi |
16 |
20-16403 |
Ndim |
8 |
3 |
Zsiz |
32 |
1 -(232 – 1) |
ZOsiz |
32 |
0-(232 – 1) |
ZTsiz |
32 |
1-(232 – 1) |
ZTOsiz |
32 |
1-(232 – 2) |
ZRsizi |
8 |
1-255 |
A.2.2 Mặc định kiều mã hóa (COD), mở rộng của ISO/IEC 15444-1
Chức năng: | Mô tả kiểu mã hóa, số lượng mức phân tách và việc phân lớp mặc định được sử dụng để nén mọi thành phần của ảnh (nếu nằm trong tiêu đề chính) hoặc khối ảnh (nếu nằm trong tiêu đề khối ảnh-bộ phận). Đối với mỗi thành phần riêng lẻ, các giá trị tham số này có thể bị ghi đè bởi một đoạn nhãn COC trong tiêu đề chính hoặc tiêu đề khối ảnh-bộ phận. |
Cách sử dụng: | Tiêu đề chính và tiêu đề khối ảnh-bộ phận đầu tiên của mỗi khối ảnh nhất định. Chỉ có một và chỉ một COD trong tiêu đề chính. Hơn nữa, mỗi khối ảnh có thể chỉ có tối đa một COD. Nếu khối ảnh có nhiều khối ảnh-bộ phận, và có đoạn nhãn này thì COD chỉ có thể có trong khối ảnh-bộ phận đầu tiên (TPsot = 0).
Khi được sử dụng trong tiêu đề chính, các giá trị tham số đoạn nhãn COD được sử dụng cho mọi khối ảnh-thành phần không có đoạn nhãn COC tương ứng trong tiêu đề chính hoặc tiêu đề khối ảnh-bộ phận. Khi được sử dụng trong tiêu đề khối ảnh-bộ phận, giá trị tham số này ghi đè lên COD và các COC của tiêu đề chính và được sử dụng cho mọi thành phần trong khối ảnh đó mà không cần một đoạn nhãn COC tương ứng trong khối ảnh-bộ phận. Do vậy, thứ tự ưu tiên như sau: COC khối ảnh-bộ phận > COD khối ảnh-bộ phận > COC chính > COD chính với ký hiệu “lớn hơn”, >, có nghĩa là đoạn nhãn lớn hơn ghi đè lên nhãn bé hơn. |
Chiều dài: | Biến thiên tùy theo giá trị của Scod (xem tham số Lcod). |
Hình A.2 – Cú pháp mặc định kiểu mã hóa
COD: | Mã nhãn. Bảng A.3 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn mặc định kiểu mã hóa. | ||
Lcod: | Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bằng công thức sau: | ||
maximum_precincts |
(A-2) |
||
user_defined_precints | |||
với maximum_precincts và user_defined_precincts được cho trong tham số Scod và number_of_resolution_levels được tính toán bằng cách sử dụng số lượng tham số mức phân tách đối với từng chiều trong ba chiều, X, Y và Z, như được cho trong tham số SPcod. Công thức thực tế để tính toán số lượng mức phân giải được cho trong B.5. | |||
Scod: | Kiểu mã hóa đối với mọi thành phần. Bảng A.4 đưa ra giá trị đối với tham số Scod. | ||
SGcod: | Các tham số đối với kiểu mã hóa được chỉ định trong Scod. Các tham số là độc lập với các thành phần và được định rõ theo thứ tự từ cao xuống thấp như trong Bảng A.5. Các tham số kiểu mã hóa thuộc trường SGcod xuất hiện theo dãy như trong Hình A.3. | ||
SPcod: | Các tham số đối với kiểu mã hóa được chỉ rõ trong Scod. Các tham số này liên quan đến mọi thành phần và được chỉ định theo thứ tự từ cao xuống thấp như trong Bảng A.6. Các tham số kiểu mã hóa trong trường SPcod xuất hiện theo dãy như trong Hình A.3. |
Bảng A.3 – Các giá trị tham số mặc định kiểu mã hóa, phần mở rộng
Tham số |
Kích thước (bit) |
Giá trị |
COD |
16 |
0xFF52 |
Lcod |
16 |
17-83 |
Scod |
8 |
Bảng A.4 |
SGcod |
32 |
Bảng A.5 |
SPcod |
Biến thiên |
Bảng A.6 |
A |
Thứ tự lũy tiến | |
B |
Số lớp | |
C |
Biến đổi đa thành phần | |
D |
Số mức phân tách dọc trục X | |
E |
Số mức phân tách dọc trục Y | |
F |
Số mức phân tách dọc trục Z | |
G |
Chiều rộng khối mã | |
H |
Chiều cao khối mã | |
I |
Chiều sâu khối mã | |
J |
Kiểu khối mã | |
K |
Nhân biến đổi dọc trục X | |
L |
Nhân biến đổi dọc trục Y | |
M |
Nhân biến đổi dọc trục Z | |
Ni – Nn |
Các kích thước phân khu |
Hình A.3 – Sơ đồ tham số kiểu mã hóa của các tham số SGcod và SPcod
Bảng A.4 – Các giá trị tham số kiểu mã hóa đối với tham số Scod
Giá trị (bit) MSB LSB |
Kiểu mã hóa |
xxxx xxx0 |
Bộ mã hóa và giải mã entropy, các phân khu có PPx = 15, PPy = 15 and PPz = 15 |
xxxx xxx1 |
Bộ mã hóa và giải mã entropy với các phân khu thông lệ như định nghĩa ở dưới |
xxxx xx0x |
Không có đoạn nhãn SOP nào được sử dụng |
xxxx xx1x |
Các đoạn nhãn SOP có thể được sử dụng |
xxxx x0xx |
Không có nhãn EPH nào được sử dụng |
xxxx x1xx |
Nhãn EPH có thể được sử dụng |
|
Tất cả các giá trị khác dùng cho dự phòng |
Bảng A.5 – Các giá trị tham số kiểu mã hóa đối với tham số Gcod
Tham số (theo thứ tự) |
Kích thước (bit) |
Giá trị |
Ý nghĩa của các giá trị SGcod |
Thứ tự lũy tiến |
8 |
Bảng A.16 của ISO/IEC 15444-1 |
Thứ tự lũy tiến |
Số lượng lớp |
16 |
1-65535 |
Số lượng các lớp |
Biến đổi đa thành phần |
8 |
Bảng A.8 của ISO/IEC 15444-2 |
Cách sử dụng biến đổi đa thành phần |
Bảng A.6 – Các giá trị tham số kiểu mã hóa của các tham số SPcod và SPcoc, phần mở rộng
Tham số (theo thứ tự) |
Kích thước (bit) |
Giá trị |
Ý nghĩa của các giá trị SPcod |
Số lượng mức phân tách dọc trục X |
8 |
0-32 |
Số lượng mức phân tách dọc trục X, NLX, 0 nghĩa là không có biến đổi |
Số lượng mức phân tách dọc trục Y |
8 |
0-32 |
Số lượng mức phân tách dọc trục Y, NLY, 0 nghĩa là không có biến đổi |
Số lượng mức phân tách dọc trục z |
8 |
0-32 |
Số lượng mức phân tách dọc trục Z, NLZ, 0 nghĩa là không có biến đổi |
Chiều rộng khối mã 3D |
8 |
Bảng A.7 |
Giá trị độ lệch theo hàm mũ của chiều rộng khối mã, xcb |
Chiều dài khối mã 3D |
8 |
Bảng A.7 |
Giá trị độ lệch theo hàm mũ của chiều dài khối mã, ycb |
Chiều sâu khối mã 3D |
8 |
Bảng A.7 |
Giá trị độ lệch theo hàm mũ của chiều sâu khối mã, zcb |
Kiểu của khối mã 3D |
8 |
Bảng A.8 |
Kiểu của các quá trình mã hóa của khối mã 3D |
Nhân biến đổi dọc trục X |
8 |
Bảng A.10 của ISO/IEC 15444-2 |
Biến đổi sóng con được sử dụng dọc trục X |
Nhân biến đổi dọc trục Y |
8 |
Bảng A.10 của ISO/IEC 15444-2 |
Biến đổi sóng con được sử dụng dọc trục Y |
Nhân biến đổi dọc trục Z |
8 |
Bảng A.10 của ISO/IEC 15444-2 |
Biến đổi sóng con được sử dụng dọc trục Z |
Kích thước phân khu |
Biến thiên |
Bảng A.9 |
Nếu Scod hoặc Scoc = xxxx xxx0 thì không có tham số này; ngược lại thì tham số này chỉ ra chiều rộng, chiều dài và chiều sâu phân khu. Tham số đầu tiên (16 bit) tương ứng với băng con NLLLL. Mỗi tham số liên tiếp tương ứng với mỗi mức phân giải liên tiếp theo thứ tự. |
Bảng A.7 – Số mũ chiều rộng, chiều cao hoặc chiều sâu của các khối mã 3D đối với các tham số SPcod và SPcoc
Giá trị (bit) |
Chiều rộng, chiều cao và chiều sâu của khối mã 3D |
xxxx 0000 – xxxx 1011 |
Các giá trị số mũ chiều rộng, chiều cao và chiều sâu của khối mã 3D xcb = giá trị, ycb = giá trị hoặc zcb = giá trị.
CHÚ THÍCH: Phần này định nghĩa lại ISO/IEC 15444-1. Chiều rộng, chiều cao và chiều sâu của khối mã 3D bị giới hạn ở các lũy thừa của 2 với kích thước nhỏ nhất là 20 và lớn nhất là 210. Hơn nữa, kích thước khối mã 3D bị giới hạn sao cho 4 ≤ xcb+ycb+zcb ≤ 18. |
Tất cả các giá trị khác dùng cho dự phòng |
Bảng A.8 – Kiểu khối mã 3D đối với các tham số SPcod và SPcoc, mở rộng
Giá trị (bit) |
Kiểu khối mã 3D |
xxxx xxx0 |
Không lựa chọn bỏ qua mã hóa số học |
xxxx xxx1 |
Lựa chọn bỏ qua mã hóa số học |
xxxx xx0x |
Không đặt lại các xác suất ngữ cảnh trên các biên thẻ mã hóa |
xxxx xx1x |
Đặt lại các xác suất ngữ cảnh trên các biên quá trình mã hóa |
xxxx x0xx |
Không kết thúc trên mỗi quá trình mã hóa |
xxxx x1xx |
Kết thúc trên mỗi quá trình mã hóa |
xxxx 0xxx |
Không có ngữ cảnh nhân quả |
xxxx 1xxx |
Các ngữ cảnh nhân quả |
xxx0 xxxx |
Không kết thúc đoán trước |
xxx1 xxxx |
Kết thúc đoán trước |
xx0x xxxx |
Không có ký hiệu phân đoạn nào được sử dụng |
xx1x xxxx |
Các ký hiệu phân đoạn được sử dụng |
Tất cả các giá trị khác dùng cho dự phòng |
Bảng A.9 – Chiều rộng, chiều dài và chiều sâu phân khu đối với các tham số SPcod và Spcoc, phần mở rộng
Giá trị (bit) |
Kích thước phân khu |
xxxx xxxx xxxx 0000 – |
4 LSB là số mũ chiều rộng phân khu PPx = giá trị. Giá trị này có thể chỉ bằng 0 tại mức phân giải tương ứng với băng NLLLL |
xxxx xxxx 0000 xxxx – |
4 bit tiếp theo là số mũ chiều dài phân khu PPy = giá trị. Giá trị này có thể chỉ bằng 0 tại mức phân giải tương ứng với băng NLLLL |
xxxx 0000 xxxx xxxx – |
4 bit tiếp theo là số mũ chiều sâu phân khu PPz = value. Giá trị này có thể chỉ bằng 0 tại mức phân giải tương ứng với băng NLLLL. |
Tất cả các giá trị khác dùng cho dự phòng. |
A.2.3 Thành phần kiểu mã hóa (COC), mở rộng của ISO/IEC 15444-1
Chức năng: | Mô tả kiểu mã hóa và số lượng mức phân tách được sử dụng để nén một thành phần nhất định. |
Cách sử dụng: | Tiêu đề chính và tiêu đề khối ảnh bộ phận đầu tiên của một khối ảnh nào đó. Cách sử dụng là tùy chọn ở cả các tiêu đề chính và khối ảnh-bộ phận. Trong cả các tiêu đề chính hoặc khối ảnh-bộ phận, mỗi thành phần nhất định chỉ có thể có tối đa một COC. Nếu có nhiều khối ảnh-bộ phận trong một khối ảnh và có đoạn nhãn này thì COC chỉ có thể có trong khối ảnh-bộ phận đầu tiên (TPsot = 0).
Đối với mỗi thành phần, khi được sử dụng trong tiêu đề chính thì COC ghi đè lên đoạn nhãn COD chính. Đối với mỗi thành phần, khi được sử dụng trong tiêu đề khối ảnh-bộ phận thì COC ghi đè lên COD tiêu đề chính, COC chính và COD khối ảnh. Do đó, thứ tự ưu tiên như sau: COC khối ảnh-bộ phận > COD khối ảnh-bộ phận > COC chính > COD chính Với dấu “lớn hơn”, >, có nghĩa là đoạn nhãn lớn hơn ghi đè lên đoạn nhãn bé hơn. |
Chiều dài: | Biến thiên tùy theo giá trị của Scoc (xem tham số Lcoc). |
Hình A.4 – Cú pháp thành phần kiểu mã hóa
COC: | Mã nhãn. Bảng A.10 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn thành phần kiều mã hóa. | ||
Lcoc: | Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bằng công thức sau: | ||
maximum_precincts AND Csiz < 257 |
(A-3) |
||
maximum_precincts AND Csiz ≥ 257 | |||
user_defined_precincts AND Csiz < 257 | |||
user_defined_precincts AND Csiz ≥ 257 | |||
Ccoc: | Chỉ số của thành phần mà đoạn nhãn này liên quan. Các thành phần có chỉ số 0, 1, 2, … | ||
Scoc: | Kiểu mã hóa đối với thành phần này. Bảng A.11 đưa ra các giá trị đối với mỗi tham số Scoc. | ||
SPcoc: | Các tham số đối với kiểu mã hóa được xác định trong Scoc. Các tham số kiểu mã hóa trong trường SPcoc xuất hiện theo dãy thứ tự như trong Hình A.5. | ||
|
|
Hình A.5 – Sơ đồ tham số kiểu mã hóa của tham số SPcoc
Bảng A.10 – Các giá trị tham số thành phần kiểu mã hóa, phần mở rộng
Tham số |
Kích thước (bit) |
Giá trị |
COC |
16 |
0xFF53 |
Lcoc |
16 |
4-102 |
Ccoc |
8 16 |
0-255; nếu Csiz < 257 0-16383; nếu Csiz ≥ 257 |
Scoc |
8 |
Bảng A.11 |
SPcoci |
Biến thiên |
Bảng A.6 |
Bảng A.11 – Các giá trị tham số kiểu mã hóa đối với tham số Scoc, phần mở rộng
Giá trị (bit) |
Kiểu mã hóa |
xxxx xxx0 |
Bộ mã hóa và giải mã Entropy với các giá trị phân khu lớn nhất PPx = PPy = PPz =15 |
xxxx xxx1 |
Bộ mã hóa và giải mã Entropy có các giá trị phân khu được xác định trong SPcoc |
Tất cả các giá trị khác dùng cho dự phòng |
A.2.4 Vùng quan tâm (RGN), mở rộng của ISO/IEC 15444-2
Chức năng: | Báo hiệu về sự có mặt của vùng quan tâm (ROI) trong dòng mã. |
Cách sử dụng: | Tiêu đề chính và tiêu đề khối ảnh-bộ phận đầu tiên của khối ảnh cụ thể. Nếu có đoạn nhãn RGN trong tiêu đề chính với Srgn = 0 thì không được có bất kỳ một đoạn nhãn RGN nào trong dòng mã với giá trị Srgn khác 0 đối với thành phần được cho bởi giá trị Crgn tương ứng. Ngược lại, nếu có đoạn nhãn RGN trong tiêu đề chính với giá trị Srgn khác 0 thì không được có bất kỳ một đoạn nhãn RGN nào trong dòng mã với Srgn = 0 đối với thành phần được cho bởi giá trị Crgn tương ứng.
Đối với mỗi khối ảnh, khi được sử dụng trong cả tiêu đề chính và tiêu đề khối ảnh-bộ phận đầu tiên thì RGN trong tiêu đề khối ảnh-bộ phận đầu tiên ghi đè lên RGN chính. Và, RGN xác định một thành phần đơn (Crgn ≠ 65 535) cũng ghi đè lên RGN xác định mọi thành phần (Crgn = 65 535). Do đó, thứ tự ưu tiên như sau: RGN khối ảnh-bộ phận (Crgn ≠ 65 535) > RGN khối ảnh-bộ phận (Crgn = 65 535) > RGN chính (Crgn ≠ 65 535) > RGN chính (Crgn = 65 535) Với dấu “lớn hơn”, >, có nghĩa là đoạn nhãn lớn hơn ghi đè lên đoạn nhãn bé hơn. |
Chiều dài: | Biến thiên |
Hình A.6 – Cú pháp vùng quan tâm
RGN: | Mã nhãn. Bảng A.12 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn vùng quan tâm. |
Lrgn: | Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). |
Crgn: | Chỉ số của thành phần mà nhãn này liên quan. Các thành phần có chỉ số 0, 1, 2,… |
Srgn: | Kiểu ROI đối với ROI hiện tại. Bảng A.16 của ISO/IEC 15444-2 đưa ra giá trị đối với tham số Srgn. |
SPrgn: | Tham số đối với kiểu ROI được chỉ định trong Srgn. SPrgn chỉ được báo hiệu đối với Srgn = 1 hoặc Srgn = 2. |
Bảng A.12 – Các giá trị tham số vùng quan tâm, phần mở rộng
Tham số |
Kích thước (bit) |
Giá trị |
RGN |
16 |
0xFF5E |
Lrgn |
16 |
5-30 |
Crgn |
16 |
Bảng A.17 của ISO/IEC 15444-2 |
Srgn |
8 |
Bảng A.16 của ISO/IEC 15444-2 |
SPrgn |
Biến thiên |
Bảng A.13 |
Bảng A.13 – Các gíá trị vùng quan tâm từ tham số SPrgn (Srgn = 1 hoặc Srgn = 2), phần mở rộng
Tham số (theo thứ tự) |
Kích thước (bit) |
Giá trị |
Ý nghĩa của giá trị SPrgn |
Dịch nhị phân |
8 |
0-255 |
Dịch nhị phân của các hệ số trong vùng quan tâm trên hình nền. |
XArgn (bên trái) |
32 |
0-(232 -1) |
Điểm lưới tọa độ tham chiếu ngang từ gốc của điểm đầu tiên. (Trong trường hợp ellipse, Srgn = 2, giá trị này không được lớn hơn chiều rộng của ảnh.) |
YArgn (ở trên) |
32 |
0-(232 -1) |
Điểm lưới tọa độ tham chiếu dọc từ gốc của điểm đầu tiên. (Trong trường hợp ellipse, Srgn = 2, giá trị này không được lớn hơn chiều cao của ảnh.) |
ZArgn (mặt trước) |
32 |
0-(232 -1) |
Điểm lưới tọa độ tham chiếu trục từ gốc của điểm đầu tiên. (Trong trường hợp ellipse, Srgn = 2, giá trị này không được lớn hơn chiều sâu của ảnh.) |
XBrgn (bên phải) |
32 |
0-(232 -1) |
Điểm lưới tọa độ tham chiếu ngang từ gốc của điểm thứ hai. |
YBrgn (ở dưới) |
32 |
0-(232 – 1) |
Điểm lưới tọa độ tham chiếu dọc từ gốc của điểm thứ hai. |
ZBrgn (mặt sau) |
32 |
0-(232 -1) |
Điểm lưới tọa độ tham chiếu trục từ gốc của điểm thứ hai. |
A.2.5 Mặc định thành phần lượng tử hóa (QCD), mở rộng của ISO/IEC 15444-1
Chức năng: | Mô tả mặc định lượng tử hóa được sử dụng để nén tất cả các thành phần chưa được xác định bởi một đoạn nhãn QCC. Đối với mỗi thành phần riêng lẻ, các giá trị tham số này có thể bị ghi đè bởi một đoạn nhãn QCC trong tiêu đề chính hoặc tiêu đề khối ảnh-bộ phận. |
Usage: | Tiêu đề chính và tiêu đề khối ảnh-bộ phận đầu tiên của một khối ảnh cụ thể. Chỉ có một và chỉ một QCD trong tiêu đề chính. Có thể có tối đa một QCD đối với mọi tiêu đề khối ảnh-bộ phận của mỗi khối ảnh. Nếu khối ảnh có nhiều khối ảnh-bộ phận, và có đoạn nhãn này thì QCD chỉ nằm trong khối ảnh-bộ phận đầu tiên (TPsot = 0).
Đối với thành phần nhất định, khi được sử dụng trong tiêu đề khối ảnh-bộ phận thì QCD đó ghi đè lên QCD chính và QCC chính. Do đó, thứ tự ưu tiên như sau: QCC khối ảnh-bộ phận > QCD khối ảnh-bộ phận > QCC chính > QCD chính Với dấu “lớn hơn”, >, có nghĩa là đoạn nhãn lớn hơn ghi đè lên đoạn nhãn bé hơn. |
Chiều dài: | biến thiên tùy theo số lượng phần tử được lượng tử hóa. |
Hình A.7 – Kiểu mặc định lượng tử hóa
QCD: | Mã nhãn. Bảng A.14 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn mặc định lượng tử hóa. | ||
Lqcd: | Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bằng công thức sau: | ||
no_quantization |
(A-4) |
||
scalar_quantization_derived | |||
scalar_quantization_expounded | |||
với number_of_sub-bands (phụ thuộc vào số lượng mức phân tách dọc trục X, Y và Z axis) được xác định trong các đoạn nhãn COD và COC, và no_quantization, scalar_quantization_derived, hoặc scalar_quantization_expounded được báo hiệu trong tham số Sqcd.
CHÚ THÍCH: Lqcd có thể được sử dụng để xác định xem trong đoạn nhãn có bao nhiêu kích thước bước lượng tử hóa. Tuy nhiên, không nhất thiết là số kích thước bước lượng tử hóa phải tương đương với số băng con hiện có do các băng con có thể bị bỏ bớt mà không cần phải sửa đoạn nhãn này. |
|||
Sqcd: | Kiểu lượng tử hóa đối với mọi thành phần | ||
SPqcdi: | Giá trị kích thước bước lượng tử hóa đối với băng con thứ i theo một thứ tự xác định (xem Phụ lục B). Số lượng tham số bằng số lượng băng con trong khối ảnh- thành phần có số lượng mức phân tách lớn nhất, NL. | ||
Bảng A-14 – Các giá trị tham số mặc định lượng tử hóa, phần mở rộng
Tham số |
Kích thước (bit) |
Giá trị |
QCD |
16 |
0xFF5C |
Lqcd |
16 |
4-441 |
Sqcd |
8 |
Bảng A.28 của ISO/IEC 15444-1 |
SPqcdi |
Biến thiên |
Bảng A.28 của ISO/IEC 15444-1 |
A.2.6 Thành phần lượng tử hóa (QCC), mở rộng của ISO/IEC 15444-1
Chức năng: | Mô tả sự lượng tử hóa được sử dụng để nén một thành phần nhất định. |
Cách sử dụng: | Tiêu đề chính và tiêu đề khối ảnh-bộ phận đầu tiên của một khối ảnh nhất định. Cách sử dụng là tùy chọn ở cả các tiêu đề chính và tiêu đề khối ảnh-bộ phận. Với mỗi thành phần nhất định, không có hơn một QCC trong các tiêu đề chính và tiêu đề khối ảnh-bộ phận. Nếu một khối ảnh có nhiều khối ảnh-bộ phận, và có đoạn nhãn này thì QCC chỉ có thể có trong khối ảnh-bộ phận đầu tiên (TPsot = 0).
Tùy chọn trong cả các tiêu đề chính và tiêu đề khối ảnh-bộ phận. Đối với mỗi thành phần nhất định, khi được sử dụng trong tiêu đề chính thì QCC ghi đè lên đoạn nhãn QCD chính. Đối với mỗi thành phần nhất định, khi được sử dụng trong tiêu đề khối ảnh-bộ phận thì QCC ghi đè lên QCD chính, QCC chính, và QCD của khối ảnh. Do đó, thứ tự ưu tiên như sau: QCC khối ảnh-bộ phận > QCD khối ảnh-bộ phận > QCC chính > QCD chính Với dấu “lớn hơn”, >, có nghĩa là đoạn lớn hơn ghi đè lên đoạn bé hơn. |
Chiều dài | biến thiên tùy theo số lượng phần tử được lượng tử. |
Hình A.8 – Cú pháp của thành phần lượng tử hóa
QCD: | Mã nhãn. Bản A.15 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn thành phần lượng tử hóa. | ||
Lqcc: | Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bằng công thức sau: | ||
no_quantization AND Csiz < 257 |
(A-5) |
||
scalar_quantization_derived AND Csiz < 257 | |||
scalar_quantization_expounded AND Csiz < 257 | |||
no_quantization AND Csiz ≥ 257 | |||
scalar_quantization_derived AND Csiz ≥ 257 | |||
scalar_quantization_expounded AND Csiz ≥ 257 | |||
CHÚ THÍCH: Lqcc có thể được sử dụng để xác định xem có bao nhiêu kích thước bước lượng tử trong đoạn nhãn. Tuy nhiên, không nhất thiết là số lượng kích thước bước lượng tử hóa phải tương đương với số lượng băng con hiện có do các băng con có thể bị bỏ bớt mà không cần phải sửa đoạn nhãn này. | |||
Cqcc: | Chỉ số của thành phần mà đoạn nhãn này liên quan. Các thành phần có chỉ số 0, 1, 2, … (8 hoặc 16 bit tùy theo kích thước Csiz.) | ||
Sqcc: | Kiểu lượng tử hóa đối với thành phần này. | ||
SPqcci: | Giá trị lượng tử hóa đối với mỗi băng con theo một thứ tự xác định (xem Phụ lục D). Số lượng tham số bằng số lượng băng con trong khối ảnh-thành phần có số lượng mức phân tách lớn nhất. | ||
Bảng A.15 – Các giá trị tham số thành phần lượng tử hóa
Tham số |
Kích thước (bit) |
Giá trị |
QCC |
16 |
0xFF5D |
Lqcc |
16 |
5-443 |
Cqcc |
8 |
0-255; nếu Csiz < 257 |
|
16 |
0-16383; nếu Csiz ≥ 257 |
Sqcc |
8 |
Bảng A.28 của ISO/IEC 15444-1 |
SPqcci |
Biến thiên |
Bảng A.28 của ISO/IEC 15444-1 |
A.2.7 Đăng ký thành phần (CRG), mở rộng của ISO/IEC 15444-1
Chức năng: | Cho phép sự đăng ký riêng của các thành phần theo các thành phần khác. Với các mục đích mã hóa, các mẫu của các thành phần được coi là nằm tại các điểm lưới tọa độ tham chiếu là bội số nguyên của XRsiz, YRsiz và ZRsiz (xem Phụ lục B). Tuy nhiên, điều này có thể không phù hợp cho việc kết xuất ảnh. Đoạn nhãn CRG mô tả “trọng tâm” của các mẫu của từng thành phần theo sự phân chia. Đoạn nhãn này không có ảnh hưởng đến việc giải mã dòng mã.
CHÚ THÍCH: Độ lệch đăng ký thành phần này là theo độ lệch ảnh (XOsiz, YOsiz và ZOsiz) và sự phân chia thành phần (XRsizi, YRsizi and ZRsizi). Ví dụ, điểm lưới tọa độ tham chiếu ngang đối với các mẫu bên trái gần nhất của thành phần c là XRsizc.[XOsiz / XRsizc] (Ngược lại đối với chiều dọc và chiều trục.) Độ lệch ngang được chỉ thị trong đoạn nhãn này là phần bổ sung vào độ lệch này. |
Cách sử dụng: | Chỉ trong tiêu đề chính. Chỉ một CRG có thể được sử dụng trong tiêu đề chính và điều này có thể áp dụng cho tất cả các khối ảnh. |
Chiều dài: | Biến thiên tùy theo số thành phần. |
CRG |
Lcrg |
Xcrgi |
Ycrgi |
Zcrgi |
|
Xcrgn |
Ycrgn |
Zcrgn |
Hình A.9 – Cú pháp đăng ký thành phần
CRG: | Mã nhãn. Bảng A.16 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn đăng ký thành phần. |
Lcrg: | Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). |
Xcrgi: | Giá trị của độ lệch ngang, theo đơn vị là 1/65536 của phân chia ngang XRsizi, đối với thành phần thứ i. Do đó, dải giá trị từ 0/65536 (mẫu tại điểm lưới tọa độ tham chiếu của mẫu) đến XRsizc (65535/65536) (ngay trước điểm lưới tọa độ tham chiếu của mẫu tiếp theo). Giá trị này được lặp lại đối với mọi thành phần. |
Ycrgi: | Giá trị của độ lệch dọc, theo đơn vị là 1/65536 của sự phân chia dọc YRsizi đối với thành phần thứ i. Do đó, dải giá trị từ 0/65536 (mẫu tại điểm lưới tọa độ tham chiếu của mẫu) đến YRsizc (65535/65536) (ngay trước điểm lưới tọa độ tham chiếu của mẫu tiếp theo). Giá trị này được lặp lại đối với mọi thành phần. |
Zcrgi: | Giá trị của độ lệch trục, theo đơn vị là 1/65536 của sự phân chia trục ZRsizi, đối với thành phần thứ i. Do đó, dải giá trị từ 0/65536 (mẫu tại điểm lưới tọa độ tham chiếu của mẫu) đến ZRsizc (65535/65536) (ngay trước điểm lưới tọa độ tham chiếu của mẫu tiếp theo). Giá trị này được lặp lại đối với mọi thành phần. |
Bảng A.16 – Các giá trị tham số đăng ký thành phần
Tham số |
Kích thước (bit) |
Giá trị |
CRG |
16 |
0xFF63 |
Lcrg |
16 |
6-65534 |
Xcrgi |
16 |
0-65535 |
Ycrgi |
16 |
0-65535 |
Zcrgi |
16 |
0-65535 |
A.2.8 Khả năng mở rộng (CAP), ISO/IEC 15444-2:2004/Adm. 2:2006
Tiêu chuẩn này yêu cầu phải có đoạn nhãn CAP trong tiêu đề chính, với trường Pcap báo hiệu việc sử dụng ISO/IEC 15444-10 như được mô tả trong ISO/IEC 15444-2. Bảng A.17 giải thích cách sử dụng tham số Ccapi trong tiêu chuẩn này.
CHÚ THÍCH: Các khả năng mở rộng này được phát triển sau phiên bản đầu tiên của ISO/IEC 15444-2, và được chi rõ trong bản sửa đổi của ISO/IEC 15444-2:2004/Amd.2:2006.
Tiêu chuẩn này yêu cầu trường Rsiz của đoạn nhãn SIZ (xem ISO/IEC 15444-2) phải báo hiệu sự có mặt của đoạn nhãn CAP bằng cách cho phép có bit có trọng số cao thứ hai. Điều này sẽ khiến các bộ giải mã không thể xử lý chính xác các dòng mã cho phép của ISO/IEC 15444-10 một cách liên tục. Do vậy, đoạn nhãn CAP nên xuất hiện ngay sau đoạn nhãn SIZ, sao cho bộ giải mã có thể dễ dàng nhận ra các dòng mã cho phép của ISO/IEC 15444-10 trước khi gặp các đoạn nhãn mở rộng bất kỳ.
Bảng A.17 – Ccapi, phần mở rộng
Giá trị (bit) |
Kiểu mã hóa |
0000 0000 0000 0000 0000 |
Không có các khả năng mở rộng |
Tất cả các giá trị khác dùng cho dự phòng |
Phụ lục B
(Quy định)
Ảnh và xếp thứ tự dữ liệu ảnh nén, phần mở rộng
B.1 Giới thiệu
Trong phụ lục này và các điều nhỏ của phụ lục, các biểu đồ và bảng chỉ có tính quy định trong trường hợp chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này mô tả các thực thể cấu trúc khác nhau và tổ chức của chúng trong dòng mã: các thành phần, các khối ảnh, các băng con và các phần nhỏ của chúng.
Phụ lục này là phần mở rộng Phụ lục B cửa ISO/IEC 15444-1 thêm tính năng mã hóa khối, tức là, từ hai thành ba chiều không gian. Các phần sau đây sẽ chỉ mô tả những phần thay đổi so với Phụ lục B của ISO/IEC 15444-1 thêm chiều trục bổ sung. Trừ khi được ghi chú rõ thì mọi mô tả và các đặc tả của ISO/IEC 15444-1 vẫn được áp dụng.
B.2 Giới thiệu các khái niệm về cấu trúc dữ liệu ảnh
Đây là nội dung cập nhật B.1 của ISO/IEC 15444-1.
Các thành phần không còn chứa các mảng hai chiều của các mẫu, nhưng chúng lại gồm các mảng ba chiều của các mẫu. Mỗi thành phần, c, bây giờ có các tham số XRsizc, YRsizc và ZRsizc xác định sự ánh xạ giữa các mẫu thành phần và các điểm lưới tọa độ tham chiếu.
Mỗi mức phân giải đều gồm các băng con [L|H|X][L|H|X][L|H|X] (không bao gồm băng con LLL) hoặc băng con NLLLL, do đó làm thay đổi số lượng băng con trên mỗi mức phân tách,m, với m < NL, từ ba thành dải [2;7] (xem Hình D.6).
Mỗi băng con đều có gốc. Các điều kiện biên của băng con là riêng cho mỗi băng con [L|H|X][L|H|X][L|H|X].
B.3 Ánh xạ thành phần vào lưới tọa độ tham chiếu
Đây là nội dung cập nhật B.2 của ISO/IEC 15444-1.
Lưới tọa độ tham chiếu trở thành không gian ba chiều của các điểm có chỉ số từ (0, 0, 0) tới (Xsiz-1, Ysiz-1, Zsiz-1). Khi đó, mỗi “vùng ảnh” được xác định trên lưới tọa độ tham chiếu bằng các tham số chiều, (Xsiz, Ysiz, Zsiz) và (XOsiz, YOsiz, ZOsiz). Cụ thể là, vùng ảnh trên lưới tọa độ tham chiếu được xác định bởi các điểm lưới tọa độ tham chiếu của chúng tại vị trí (XOsiz, YOsiz, ZOsiz) và (Xsiz-1, Ysiz-1, Zsiz-1).
Các mẫu của thành phần c bây giờ nằm tại các vị trí bội số nguyên của (XRsizc, YRsizc, ZRsizc) trên lưới tọa độ tham chiếu. Mỗi vùng thành phần là một phiên bản mẫu con của lưới tọa độ tham chiếu có tọa độ (0, 0, 0) là điểm chung của từng thành phần.
Do đó, các mẫu của thành phần c được ánh xạ vào một hình khối có các tọa độ góc (x0, y0, z0) và (X1 – 1, y1 -1, z1 -1), với x0, y0, x1 và y1 được xác định bởi công thức B-1 của ISO/IEC 15444-1 và z0 và z1 xác định như sau:
(B-1)
Do đó, ba chiều của thành phần c được xác định bởi
(chiều rộng, chiều cao, chiều sâu) = (x1 – x0, y1 – y0, z1 – z0) (B-2)
Các tham số Zsiz, ZOsiz và ZRsizc đều được xác định trong đoạn nhãn NSI (xem A.2.1).
B.4 Phân chia vùng ảnh thành các khối ảnh và các khối ảnh-thành phần
Đây là nội dung cập nhật B.3 của ISO/IEC 15444-1.
Lưới tọa độ tham chiếu được phân chia thành một mảng ba chiều kích thước thông thường của các khối ảnh. Trên lưới tọa độ tham chiếu, kích thước khối ảnh và các độ lệch phân chia khối ảnh được xác định tương ứng bởi các cặp chiều (XTsiz, YTsiz, ZTsiz) và (XTOsiz, YTOsiz, ZTOsiz). ZTsiz và ZTOsiz là các tham số từ đoạn nhãn NSI.
Mọi khối ảnh đều có chiều rộng các điểm lưới tọa độ tham chiếu XTsiz, chiều cao các điểm lưới tọa độ tham chiếu YTsiz và chiều sâu các điểm lưới tọa độ tham chiếu ZTsiz. Góc trên bên trái mặt trước của khối ảnh đầu tiên (khối ảnh 0) có độ lệch so với góc trên bên trái mặt trước của lưới tọa độ tham chiếu là (XTOsiz, YTOsiz, ZTOsiz). Các khối ảnh được đánh số theo thứ tự quét mành (tức là, từ trái sang phải, cao xuống thấp, trước ra sau). Con số này là chỉ số khối ảnh.
Các độ lệch lưới khối ảnh (XTOsiz, YTOsiz, ZTOsiz) bị giới hạn không được lớn hơn các độ lệch vùng ảnh. Điều này được thể hiện bằng công thức B-3 của ISO/IEC 15444-1 và được bổ sung bằng dải sau đây:
0 ≤ ZTOsiz ≤ ZOsiz (B-3)
Kích thước khối ảnh cộng với độ lệch khối ảnh phải lớn hơn độ lệch vùng ảnh. Điều này đảm bảo rằng khối ảnh đầu tiên (khối ảnh 0) sẽ chứa ít nhất một điểm lưới tọa độ tham chiếu từ vùng ảnh. Điều này đã được thể hiện bởi công thức B-4 của ISO/IEC 15444-1 và được bổ sung bằng dải sau đây:
ZTsiz + ZTOsiz > ZOsiz (B-4)
Số lượng khối ảnh trên chiều ngang (X) (numXtiles) và chiều dọc (Y) (numYtiles) được cho bởi công thức B-5 của ISO/IEC 15444-1. Số lượng khối ảnh trên chiều trục (Z) (numZtiles) được cho như sau:
(B-5)
Để thuận tiện trong việc mô tả thì các khối ảnh cần được đánh số theo vị trí ngang, dọc và trục. Đặt px là chỉ số ngang của một khối ảnh và py là chỉ số dọc của khối ảnh, khi đó pz sẽ là chỉ số trục của khối ảnh, lấy từ 0 đến (numZtiles – 1). Công thức sau định nghĩa lại px and py (Công thức B-6 của T.800 I ISO/IEC 15444-1) và định nghĩa pz:
px = mod(mod(t,numXtiles · numYtiles),numXtiles)
(B-6)
Đối với các tọa độ của một khối ảnh cụ thể trên lưới tọa độ tham chiếu, chúng được mô tả bằng các công thức sau:
tx0(px,py,pz) = max(XTOsiz + px · XTsiz,XOsiz)
ty0(px,py,pz) = max(YTOsiz + py · YTsiz,YOsiz)
tz0(px,py,pz) = max(ZTOsiz + pz · ZTsiz,ZOsiz)
tx1(px,py,pz) = min(XTOsiz + (px+1) · XTsiz,Xsiz) (B-7)
ty1(px,py,pz) = min(YTOsiz + (py+1) · YTsiz,Ysiz)
tz1(px,py,pz) = min(ZTOsiz + (pz+1) · ZTsiz,Zsiz)
Với tx0(px, py, pz), ty0(px, py, pz) và tz0(px, py, pz) là các tọa độ của góc trên bên trái mặt trước của khối ảnh và tx1(px, py, pz) – 1, ty1(px, py, pz) – 1 và tz1(px, py, pz) – 1 là các tọa độ của góc dưới bên phải mặt sau của khối ảnh. Chúng ta thường bỏ qua các tọa độ của khối ảnh khi nói đến một khối ảnh cụ thể và thay vào đó lại nói đến các tọa độ (tx0, ty0, tz0) và (tx1, ty1, tz1).
Do đó, các chiều của một khối ảnh trên lưới tọa độ tham chiếu là:
(tx1 – tx0, ty1 – ty0, tz1 – tz0) (B-8)
Trong miền của thành phần ảnh i, các tọa độ của mẫu trên bên trái mặt trước được cho bởi (tcx0, tcy0, tcz0) và các tọa độ của mẫu dưới bên phải mặt sau dưới được cho bởi (tcx1, tcy1, tcz1), với tcx0, tcy0, tcx1 và tcy1 đã được mô tả trong Công thức B-12 của ISO/IEC 15444-1 và tcz0 và tcz1 được cho bởi công thức sau:
(B-9)
Do vậy, các chiều của khối ảnh-thành phần trong lưới tọa độ tham chiếu là:
(tcx1 – tcx0, tcy1 – tcy0, tcz1 – tcz0) (B-10)
B.5 Phân chia khối ảnh-thành phần biến đổi thành các mức phân giải và các băng con
Đây là nội dung cập nhật B.5 của ISO/IEC 15444-1.
CHÚ THÍCH: Mặc dù ISO/IEC 15444-10 (JP3D) cho phép từng chiều trong ba chiều có số lượng mức phân tách khác nhau (chiều ngang biểu thị bằng X, chiều dọc biểu thị bằng Y và chiều trục bằng Z), điều này về cơ bản là khác với Phụ lục F của ISO/IEC 15444-2: “Sự phân tách tùy ý của các khối ảnh-thành phần”. Sự phân tách của một khối ảnh-thành phần được mô tả trong tiêu chuẩn này KHÔNG PHẢI là tùy ý.
Mỗi khối ảnh-thành phần được biến đổi sóng con với các mức phân tách NLX trong chiều ngang, các mức phân tách NLY trong chiều dọc và các mức NLZ trong chiều trục như được mô tả trong Phụ lục D. Chiều có số lượng mức phân tách lớn nhất cũng quyết định số lượng mức phân giải. Do đó, với NL = max(NLX, NLY, NLZ) như xác định trong D.3.2, thì sẽ có (NL + 1) mức phân giải riêng, biểu thị bằng r = 0, 1,…, NL. Mỗi mức phân giải, r, được thể hiện bằng băng n[L|X][L|X][L|X], có n = NL – r, với loại băng con thực tế được xác định bằng số lượng phân tách trong mỗi chiều (xem D.4.1). Ví dụ, khi NLX bằng 3, NLY bằng 3 và NLZ bằng 2, thì tại r = 0, mức phân giải thấp nhất được biểu thị bằng băng 3LLX, còn tại r = 1, mức phân giải được biểu thị bằng băng 2LLL. Phần này mô tả các chiều của sự phân giải giảm dần này.
Các tọa độ của một khối ảnh-thành phần nào đó có liên quan đến lưới tọa độ tham chiếu tại một mức phân giải cụ thể, r, sẽ sinh ra các tọa độ của mẫu trên bên trái mặt trước, (trx0, try0, trz0) và các tọa độ của mẫu dưới bên phải mặt sau, (trx1, try1 – 1, trz1 – 1), với:
(B-11)
Theo cách tương tự, các tọa độ khối ảnh có thể được ánh xạ vào băng con bất kỳ, b, sinh ra các tọa độ của mẫu trên bên trái mặt trước (tbx0, tby0, tbz0) và các tọa độ của mẫu dưới bên phải mặt sau (tbx1 – 1, tby1 – 1, tbz1 – 1) với:
(B-12)
với nxb, nyb và nzb, được xác định trong Công thức B-13, thể hiện các mức phân tách tương ứng đối với các hướng ngang (X), hướng dọc (Y) và hướng trục (Z) của băng con b. Các đại lượng (xob, yob, zob) được cho trong Bảng B.1.
nxb = min(NL – r + 1, NLX)
nyb = min(NL – r + 1, NLY) (B-13)
nzb = min(NL – r + 1, NLZ)
Bảng B.1 – Các đại lượng (xob, yob, zob) đối với băng con b
Loại băng con |
xob |
yob |
zob |
[L|X][L|X][L|X] |
0 |
0 |
0 |
H[L|X][L|X] |
1 |
0 |
0 |
[L|X]H[L|X] |
0 |
1 |
0 |
HH[L|X] |
1 |
1 |
0 |
[L|X][L|X]H |
0 |
0 |
1 |
H[L|X]H |
1 |
0 |
1 |
[L|X]HH |
0 |
1 |
1 |
HHH |
1 |
1 |
1 |
Đối với mỗi băng con, các tọa độ này xác định các biên khối ảnh trong các miền băng con riêng biệt. Hơn nữa, kích thước của mỗi băng con được cho bởi:
(tbx1 – tbx0, tby1 – tby0, tbz1 – tbz0) (B-14)
B.6 Phân chia các mức phân giải thành các phân khu
Đây là nội dung cập nhật B.6 của ISO/IEC 15444-1.
Xét một khối ảnh-thành phần cụ thể và mức phân giải có các tọa độ mẫu biên trong miền ảnh phân giải giảm là (trx0, try0, trz0) và (trx1 – 1, try1 – 1, trz1 – 1), như đã được mô tả ở trên. Tương tự với phương pháp đã được mô tả trong B.6 của ISO/IEC 15444-1, mức phân giải của khối ảnh-thành phần ba chiều được chia thành các phân khu, sử dụng trx0, trx1, try0 và try1, và cả trz0 và trz1. Phân khu này được chốt tại (0, 0, 0), sao cho góc trên bên trái mặt trước của phân khu bất kỳ nào đó khi được phân chia sẽ nằm tại vị trí là các bội số nguyên của (2PPx, 2PPy, 2PPz) với PPx, PPy và PPz đã được báo hiệu trong các đoạn nhãn COD hoặc COC. Cũng như đối với PPx và PPy, PPz có thể khác nhau đối với mỗi khối ảnh- thành phần và mức phân giải. PPz tối thiểu phải bằng 1 đối với mọi mức phân giải r, trừ khi r = 0 thì PPz được phép bằng 0.
Số lượng phân khu của khối ảnh-thành phần tại mức phân giải r được cho bởi Công thức B-16 của ISO/IEC 15444-1 và bởi công thức sau:
trz1 > trz0
trz1 = trz0 |
(B-15) |
Thậm chí nếu Công thức B-16 của ISO/IEC 15444-1 hoặc B-15 của tiêu chuẩn này chỉ ra rằng cả numprecinctswide, numprecinctshigh, và numprecinctsdeep đều bằng 0, thì một số hoặc tất cả các phân khu đều có thể vẫn trống như đã được giải thích trong B.6 của ISO/IEC 15444-1. Chỉ số phân khu chạy từ 0 đến numprecincts-1 với numprecincts = numprecinctswide·numprecinctshigh·numprecinctsdeep theo thứ tự quét mành (tức là, từ trái sang phải, trên xuống dưới, trước ra sau). Chỉ số này được sử dụng để xác định thứ tự xuất hiện trong dòng mã của các gói tin tương ứng với từng phân khu, như đã được giải thích trong B.12 của ISO/IEC 15444-1.
B.7 Phân chia các băng con thành các khối mã
Đây là nội dung cập nhật B.7 của ISO/IEC 15444-1.
Các băng con được phân chia thành các khối mã 3D dạng khối chữ nhật để dùng cho mục đích mô hình hóa và mã hóa hệ số. Kích thước của mỗi khối mã được xác định từ ba tham số, xcb, ycb và zcb, như đã được báo hiệu trong các đoạn nhãn COD hoặc COC. Kích thước khối mã đối với từng băng con tại một mức phân giải nhất định được xác định là 2xcb’ x 2ycb’ x 2zcb’ với xcb’ và ycb’ được mô tả trong Công thức B-17 và B-18 của ISO/IEC 15444-1 và zcb’ được cho bởi:
zcbʹ = |
r > 0 |
(B-16) |
|
r = 0 |
Các công thức này phản ánh một thực tế là kích thước khối mã bị giới hạn bởi cả kích thước phân khu và kích thước khối mã, trong đó các tham số của chúng, xcb, ycb và zcb, là đồng nhất cho mọi băng con trong khối ảnh-thành phần. Giống như đối với phân khu, việc phân chia khối mã được chốt tại (0, 0, 0). Do đó, tất cả các biên của khối mã tham gia vào việc phân chia sẽ có vị trí tại x = gx2xcbʹ, y = gy2ycbʹ và z = gz2zcbʹ với gx, gy và gz là các số nguyên.
B.8 Gói tin
Đây là nội dung cập nhật B.9 của ISO/IEC 15444-1.
Mọi dữ liệu ảnh nén thể hiện một khối ảnh, lớp, thành phần, mức phân giải và phân khu nào đó xuất hiện trong dòng mã trong một đoạn tiếp giáp đều được gọi là gói tin. Dữ liệu gói tin được phân định tại các biên 8-bit (một byte).
Như được xác định trong Phụ lục D, mức phân giải r = 0 chứa các hệ số băng con của băng NLLLL, với NL là số lượng mức phân tách được xác định trong D.3.2. Mỗi mức phân giải tiếp theo, r > 0, chứa các hệ số băng con của các băng con n[L|H|X][L|H|X][L|H|X], trừ nLLL, như được xác định trong Phụ lục D, với n = NL – r + 1. Mỗi khối ảnh-thành phần có NL mức phân tách sẽ có (NL + 1) mức phân giải.
Dữ liệu ảnh nén trong mỗi gói tin được lập thứ tự sao cho sự đóng góp từ các băng con LLL, XLL, LXL, LLX, LXX, XLX, XXL, HLL, HXL, HLX, HXX, LHL, XHL, LHX, XHX, HHL, HHX, LLH, XLH, LXH, XXH, HLH, HXH, LHH, XHH và HHH cũng xuất hiện theo thứ tự đó (tức là, thứ tự quét Morton). Trong mỗi băng con, các đóng góp của khối mã xuất hiện theo thứ tự quét mành, giới hạn ở các biên được thiết lập bởi phân vùng liên quan. Mức phân giải r = 0 chỉ chứa băng NLLLL và các mức phân giải r > 0 có thể chỉ chứa một vài trong số NL[L|H|X][L|H|X][L|H|X] băng, trừ NLLLL. Chỉ các khối mã chứa các mẫu từ băng con liên quan, giới hạn trong phân vùng, mới có mặt trong gói tin đó.
Dữ liệu gói tin được chứa trong phần tiêu đề gói tin có cú pháp mô tả trong B.10 của ISO/IEC 15444-1 và sau đó là thân gói tin chứa các byte mã thực tế được đóng góp bởi từng khối mã liên quan. Thứ tự xác định ở trên được tuân thủ trong việc xây dựng cả tiêu đề gói tin và thân gói tin.
B.9 Mã hóa thông tin tiêu đề gói tin
Cập nhật của B.10 của ISO/IEC 15444-1.
B.9.1 Cây thẻ
B.10.2 của T.8001 | ISO/IEC 15444-1 mô tả các cây thẻ hai chiều. Các cây thẻ ba chiều được yêu cầu cho mục đích mở rộng ba chiều.
Cây thẻ 3D là cách thể hiện mảng ba chiều của các số nguyên không âm theo phương thức phân cấp.
Cây thẻ 3D lần lượt thiết lập các mức phân giải giảm dần của mảng ba chiều, hình thành một cây. Tại mọi điểm của cây, số nguyên nhỏ nhất của các điểm đỉnh (tối đa là 8) bên dưới được ghi lại. Ký hiệu qi(mx, my, mz) là giá trị tại điểm thứ mx từ phía trái, thứ my từ trên và thứ mz từ mặt trước, ở mức thứ i. Mức 0 là mức thấp nhất của cây thẻ và chứa điểm cao nhất.
Xem B.10.2 của ISO/IEC 15444-1 để có thêm thông tin về cách thức mã hóa và giải mã thực tế cho các giá trị theo cây thẻ. Các mô tả trong tài liệu này không phụ thuộc vào số lượng chiều thực tế.
B.9.2 Thứ tự thông tin trong gói tin
Đây là nội dung cập nhật B.10.8 của ISO/IEC 15444-1.
Dưới đây là thứ tự thông tin tiêu đề gói tin của gói tin thuộc một lớp, khối ảnh-thành phần, mức phân giải và phân vùng nhất định.
bit đối với gói có độ dài bằng 0 hoặc khác 0
đối với từng băng con ([L|H|X][L|H|X][L|H|X])
đối với tất cả các khối mã trong băng con này được giới hạn trong phân khu ảnh liên quan, theo thứ tự quét mành
các bit bao hàm khối mã (nếu không bao gồm trước đây thì là cây ghi nhãn hoặc một bit) nếu khối mã bao gồm
nếu đối tượng đầu tiên của khối mã
thông tin mặt phẳng bit
số lượng bước mã hóa bao gồm
tăng chỉ số độ dài khối mã (Lblock)
đối với từng đoạn từ mã
chiều dài đoạn từ mã
B.10 Thứ tự lũy tiến
Đây là nội dung cập nhật B.12 của ISO/IEC 15444-1.
Đối với mỗi khối ảnh-bộ phận, các gói tin đều chứa tất cả các dữ liệu ảnh nén từ một lớp, một thành phần, một mức phân giải, và một phân vùng cụ thể. Thứ tự xuất hiện của các gói tin này trong dòng mã được gọi là thứ tự lũy tiến. Việc lập thứ tự các gói tin có thể thực hiện trên bốn trục: lớp, thành phần, mức phân giải và phân khu.
Các thành phần có thể có số lượng mức phân giải khác nhau. Trong trường hợp này, mức phân giải tương ứng với băng con NLLLL là mức phân giải đầu tiên (r = 0) đối với mọi thành phần. Các chỉ số được đồng bộ từ điểm này trở đi.
B.10.1 Xác định thứ tự lũy tiến
Phần này mô tả các thuật toán xác định năm thứ tự lũy tiến có thể. Về cơ bản, chúng giống các thuật toán đã được mô tả trong B.12.1 của ISO/IEC 15444-1, nhưng được mở rộng thành ba chiều. Các đường nét đậm chỉ ra các bổ sung cần thiết cho chiều thứ ba.
Các đoạn nhãn COD báo hiệu thứ tự được sử dụng trong số năm thứ tự lũy tiến (xem A.6.1 của ISO/IEC 15444-1). Thứ tự lũy tiến có thể còn bị ghi đè với đoạn nhãn POC (xem A.6.6 của ISO/IEC 15444-1) trong mọi tiêu đề khối ảnh-bộ phận. Đối với mỗi thứ tự lũy tiến có thể, cơ chế để xác định thứ tự lũy tiến của các gói tin sẽ được mô tả dưới đây.
B.10.1.1 Lũy tiến lớp-mức phân giải-thành phần-vị trí
Xem B.12.1.1 của ISO/IEC 15444-1.
B.10.1.2 Lũy tiến mức phân giải-lớp-thành phần-vị trí
Xem B.12.1.2 của ISO/IEC 15444-1.
B.10.1.3 Lũy tiến mức phân giải-vị trí-thành phần-lớp
Lũy tiến mức phân giải-vị trí-thành phần-lớp đối với ba chiều được định nghĩa là sự chèn các gói tin theo thứ tự sau:
đối với mỗi r = 0,…, Nmax
đối với mỗi z = tz0,…, tz1 – 1,
đối với mỗi y = ty0,…, ty1 – 1,
đối với mỗi x = tx0,…, tx1 – 1,
đối với mỗi i = 0,…, Csiz – 1
nếu ((z chia hết cho ZRsiz(i) x ) OR ((z = tz0) AND (trz0 x
không chia hết cho )))
nếu ((y chia hết cho YRsiz(i) x ) OR ((y = ty0) AND (try0 x
không chia hết cho )))
nếu ((x chia hết cho XRsiz(i) x ) OR ((x = tx0) AND (trx0 x
không chia hết cho )))
đối với phân khu ảnh kế tiếp, k, nếu nó tồn tại,
đối với mỗi I = 0,…, L-1
gói cho thành phần ảnh I, mức phân giải r, lớp ảnh I, và phân khu ảnh k
Trong đó, k có thể thu được từ công thức sau:
(B-17)
Để áp dụng lũy tiến này, các giá trị XRsiz, YRsiz và ZRsiz phải là lũy thừa hai đối với mỗi thành phần.
B.10.1.4 Lũy tiến vị trí-thành phần-mức phân giải-lớp
Lũy tiến vị trí-thành phần-mức phân giải-lớp được định nghĩa là sự chèn các gói tin theo thứ tự sau:
đối với mỗi z = tz0,…, tz1 – 1,
đối với mỗi y = ty0,…, ty1 – 1,
đối với mỗi x = tx0,…, tx1 – 1,
đối với mỗi i = 0,…, Csiz – 1
đối với mỗi r = 0,…, Nmax, với NL là số mức phân tách đối với thành phần I,
nếu ((z chia hết cho ZRsiz(i) x ) OR ((z = tz0) AND (tz0 x
không chia hết cho )))
nếu ((y chia hết cho YRsiz(i) x ) OR ((y = ty0) AND (try0 X
không chia hết cho )))
nếu ((x chia hết cho XRsiz(i) x ) OR ((x = tx0) AND (trx0 x
không chia hết cho )))
đối với phân khu ảnh kế tiếp, k, nếu nó tồn tại,
đối với mỗi I = 0,..., L-1
gói cho thành phần ảnh I, mức phân giải r, lớp ảnh l, và phân khu ảnh k
Trong đó, k có thể được nhận từ Công thức B-17. Để áp dụng lũy tiến này, các giá trị XRsiz, YRsiz và ZRsiz phải là lũy thừa hai đối với mỗi thành phần.
B.10.1.5 Lũy tiến thành phần-vị trí-mức phân giải-lớp
Lũy tiến thành phần-vị trí-mức phân giải-lớp được định nghĩa là sự chèn các gói tin theo thứ tự sau:
đối với mỗi i = 0,…, Csiz -1
đối với mỗi z = tz0,…, tz1 – 1,
đối với mỗi y = ty0,…, ty1 – 1,
đối với mỗi x = tx0,…, tx1 – 1,
đối với mỗi r = 0,…, Nmax, với NL là số mức phân tách đối với thành phần I,
nếu ((z chia hết cho ZRsiz(i) x ) OR ((z = tz0) AND (trz0 x
không chia hết cho )))
nếu ((y chia hết cho YRsiz(i) x ) OR ((y = ty0) AND (try0 x
không chia hết cho )))
nếu ((x chia hết cho XRsiz(i) x ) OR ((x = tx0) AND (trx0 x
không chia hết cho )))
đối với phân khu ảnh kế tiếp, k, nếu nó tồn tại,
đối với mỗi I = 0,…, L – 1
gói cho thành phần ảnh I, mức phân giải r, lớp ảnh l, và phân khu ảnh k
Trong đó, k có thể nhận được từ Công thức B-17.
Phụ lục C
(Quy định)
Mô hình hóa bit hệ số
C.1. Giới thiệu
Trong phụ lục này và các điều nhỏ của phụ lục, các sơ đồ và bảng chỉ có tính bắt buộc nếu chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này chính thức mở rộng Phụ lục D của ISO/IEC 15444-1 thêm tính năng mã hóa khối
Phụ lục này đề cập đến việc mô hình hóa và quét các bit hệ số biến đổi.
Các khối mã (xem Phụ lục B) được mã hóa phẳng bit tại một thời điểm tính từ mặt phẳng bit có ý nghĩa cao nhất có một phần tử khác 0 đến mặt phẳng bit có ý nghĩa thấp nhất. Đối với mỗi mặt phẳng bit trong khối mã, một kiểu quét khối mã đặc biệt được sử dụng cho mỗi quá trình mã hóa trong ba quá trình mã hóa. Mỗi bit hệ số trong mặt phẳng bit chỉ xuất hiện trong một trong ba thẻ mã hóa được gọi là lan truyền có nghĩa, tinh chỉnh biên độ và làm sạch. Đối với mỗi thẻ, các ngữ cảnh được thiết lập cho bộ mã hóa và giải mã số học, CX, cùng với dòng bit, CD (xem C.3 của. ISO/IEC 15444-1).
C.2. Kiểu quét khối mã trong các khối mã, phần mở rộng
Mỗi mặt phẳng bit của một khối mã đều được quét theo một thứ tự riêng. Khối mã 3D được xử lý theo sọc, mỗi sọc, chứa bốn hàng (hoặc tất cả các hàng còn lại nếu ít hơn bốn) và trải theo chiều rộng của khối mã 3D. Mỗi sọc được xử lý theo từng cột từ trên xuống dưới và từ trái sang phải. Do đó, toàn bộ khối mã 3D được quét theo từng lát ảnh. Trong mỗi lát ảnh, tuân thủ theo ISO/IEC 15444-1.
C.3. Các cập nhật về mô hình ngữ cảnh
Đối với việc mô hình hóa ngữ cảnh, mô hình được mô tả trong Phụ lục D của ISO/IEC 15444-1 được thay đổi theo các quá trình mã hóa lan truyền có nghĩa và làm sạch.
Vectơ ngữ cảnh đối với một hệ số hiện tại cụ thể là vectơ nhị phân gồm các trạng thái trọng số của 8 hệ số bên cạnh gần nhất trong mặt phẳng XY, như mô tả trong Hình D.2 của ISO/IEC 15444-1. Mọi hệ số bên cạnh gần nhất nằm ngoài khối mã của hệ số hiện tại đều được coi là không có nghĩa (tức là, chúng được coi như có trạng thái trọng số bằng 0) khi thiết lập vectơ ngữ cảnh để giải mã hệ số hiện tại.
Thay cho Bảng D.1 của ISO/IEC 15444-1, các ngữ cảnh liên quan được quy định trong Bảng C.1 bên dưới.
Bảng C.1 – Các ngữ cảnh đối với các quá trình mã hóa lan truyền có nghĩa và làm sạch
Các băng con có định hướng chính L[L|H|X][L|H|X], X[L|H][L|H|X] hoặc XX[L|H] |
Các băng con có định hướng chính H[L|X][L|H|X] |
Các băng con có định hướng chính HH[L|H|X] |
Nhãn ngữ cảnha) |
|||||
|
||||||||
2 |
xb) |
x |
x |
2 |
x |
x |
≥ 3 |
8 |
1 |
≥ 1 |
x |
≥ 1 |
1 |
x |
≥ 1 |
2 |
7 |
1 |
0 |
≥ 1 |
0 |
1 |
≥ 1 |
0 |
2 |
6 |
1 |
0 |
0 |
0 |
1 |
0 |
≥ 2 |
1 |
5 |
0 |
2 |
x |
2 |
0 |
x |
1 |
1 |
4 |
0 |
1 |
x |
1 |
0 |
x |
0 |
1 |
3 |
0 |
0 |
≥ 2 |
0 |
0 |
≥ 2 |
≥ 2 |
0 |
2 |
0 |
0 |
1 |
0 |
0 |
1 |
1 |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
a) Lưu ý rằng các nhãn ngữ cảnh được đánh số chỉ để tiện lợi trong việc định danh ở tiêu chuẩn này. Các định danh thực tế sẽ cần được xem xét khi triển khai.
b) x = “không quan tâm”. |
Phụ lục D
(Quy định)
Biến đổi sóng con rời rạc của các khối ảnh – thành phần
D.1 Giới thiệu
Trong phụ lục này và các điều nhỏ của phụ lục, các lưu đồ và bảng chỉ có tính bắt buộc khi chúng chỉ rõ đầu ra mà các triển khai khác sẽ phải tuân thủ.
Phụ lục này mô tả biến đổi sóng con rời rạc thuận ba chiều được áp dụng cho mỗi khối ảnh–thành phần và chỉ rõ biến đổi sóng con rời rạc ngược ba chiều được sử dụng để phục dựng khối ảnh-thành phần [3], [4] và [5]. Về cơ bản, phụ lục này mở rộng Phụ lục F của ISO/IEC 15444-1 thêm chức năng mã hóa khối.
D.2 Các tham số khối ảnh-thành phần
Xét khối ảnh-thành phần được xác định bởi các tọa độ tcx0, tcx1, tcy0, tcy1, tcz0 và tcz1 cho trong Công thức B-12 của ISO/IEC 15444-1 và Công thức B-9 của tiêu chuẩn này. Khi đó, các tọa độ (x,y,z) của khối ảnh-thành phần (có các giá trị mẫu l(x,y,z)) nằm trong dải xác định bởi:
tcx0 ≤ x < tcx1, tcy0 ≤ y < tcy1 và tcz0 ≤ z < tcz1 (D-1)
D.3 Biến đổi sóng con rời rạc
D.3.1 Lọc thông thấp và thông cao (tham khảo)
Xem F.2.1 của ISO/IEC 15444-1.
D.3.2 Các mức phân tách
Mỗi khối ảnh-thành phần được biến đổi thành một tập các tín hiệu băng con ba chiều (được gọi là các băng con), mỗi tín hiệu băng con thể hiện hoạt động của tín hiệu trong các băng tần khác nhau, tại các phân giải không gian khác nhau. NLX biểu thị số lượng mức phân tách theo chiều ngang, NLY biểu thị số mức phân tách theo chiều dọc và NLZ biểu thị số lượng mức phân tách theo chiều trục. Trong tiêu chuẩn này, NL = max(NLX, NLX, NLX).
D.3.3 Các bộ lọc sóng con rời rạc (tham khảo)
Xem F.2.3 của ISO/IEC 15444-1.
D.4 Biến đổi sóng con rời rạc nghịch
D.4.1 Thủ tục IDWT
Biến đổi sóng con rời rạc nghịch (IDWT) biến đổi một tập các băng con, ab(ub,vb,wb) thành một khối ảnh-thành phần dịch mức DC, l(x, y, z) (thủ tục IDWT). Thủ tục IDWT (xem Hình D.1) có đầu vào là tập các tham số NLX, NLY và NLZ, chúng thể hiện số lượng mức phân tách ở mỗi chiều của ba chiều và được báo hiệu trong các nhãn COD hoặc COC (xem A.2.2 và A.2.3).
Hỉnh D.1 – Các đầu vào và đầu ra của thủ tục IDWT
Các băng con được gán nhãn theo cách sau: một chỉ số lev tương ứng với mức phân tách, tiếp đó là ba chữ cái trong số L, H hoặc X. Do đó, mỗi nhãn băng con sẽ có dạng Iev[L|H|X][L|H|X][L|H|X].
Băng con b = Iev[L|X][L|X][L|X] tương ứng với một phiên bản giảm kích thước của băng con (lev– 1)[L|X][L|X][L|X] qua lọc thông thấp cho các hướng (ngang, dọc và/hoặc trục) thể hiện bằng chữ cái L. Nếu tại mức phân tách (lev – 1), một hướng nào đó không được lọc thông thấp (tức là, chữ cái X được sử dụng), thì tín hiệu có thể không được lọc thông thấp nữa ở mọi mức phân tách cao hơn tiếp theo, n > (lev – 1). Do đó, khi số lượng phân tách ở hướng d (với d là X, Y hoặc Z), NLd nhỏ hơn lev thì loại phân tách của chiều tương ứng là X; ngược lại sẽ là L. Băng con b = 0LLL tương ứng với khối ảnh- thành phần ban đầu.
Tương tự như F.3.1 của ISO/IEC 15444-1, các băng con được báo hiệu trong dòng mã theo thứ tự như sau:
NLLLL, NLXLL, NLLXL, NLLLX, NLLLX, NLXLX, NLXXL, NLHLL, NLHXL, NLHLX, NLHXX, NLLHL, NLXHL, NLLHX, NLXHX, NLHHL, NLHHX, NLLLH, NLXLH, NLLXH, NLXXH, NLHLH, NLHXH, NLLHH, NLXHH, NLHHH, (NL-1)HHL, (NL-1)HXL, (NL-1)HLX, (NL-1)HXX, (NL-1)LHL, (NL-1)XHL, (NL-1)LHX, …, 1XHX, 1HHL, 1HHX, 1LLH, 1XLH, 1LXH, 1XXH, 1HLH, 1HXH, 1LHH, 1XHH, 1HHH.
Lưu ý rằng, trong danh sách các băng con ở trên, chỉ các băng con tồn tại, có các tham số NLX, NLY và NLZ, là sẽ có mặt trong dòng mã. Đây là các băng con chính xác cần để phục dựng đầy đủ khối ảnh- thành phần ban đầu.
Hình D.2 – Thủ tục IDWT
Như trong F.3.1 của ISO/IEC 15444-1, thủ tục IDWT bắt đầu với việc khơi tạo biến lev (mức phân tách hiện tại) thành NL. Thủ tục 3D_SR (xem D.4.2) được thực hiện tại mọi mức lev, với mức lev giảm ở mỗi lần lặp, cho đến khi NL lần lặp được hoàn tất. Thủ tục 3D_SR được lặp lại ở băng con lev[L|X][L|X][L|X] sinh ra tại mỗi lần lặp.
Cuối cùng, băng con a0LLL(u0LLL,u1LLL,v0LLL,v1LLL,w0LLL,w1LLL) sẽ là mảng đầu ra l(x, y, z).
Như đã được định nghĩa trong Công thức B-12, chỉ số của các hệ số băng con đối với một băng con b nhất định sẽ nằm trong dải được xác định bởi:
tbx0 ≤ ub < tbx1, tby0 ≤ v < tby1 và tbz0 ≤ wb < tbz1 (D-2)
D.4.2 Thủ tục 3D_SR
Thủ tục 3D_SR thực hiện phục dựng băng con a(lev-1)[L|X][L|X][L|X](u,v,w) từ các băng con alev[L|H|X][L|H|X][L|H|X](u,v,w) nhất định. Đầu vào của 3D_SR là tổng số lượng hệ số của băng con (lev– 1)[L|X][L|X][L|X] được phục dựng và bằng tổng các tổng số lượng hệ số của các băng con được sử dụng.
Hình D.3 – Các đầu vào và đầu ra của thủ tục 3D_SR
Các băng con alev[L|H|X][L|H|X][L|H|X](u,v,w) được hợp nhất thành mảng a(u,v,w) bằng thủ tục TO_ARRAY. Mảng tạm thời này được sử dụng để khôi phục các kết quả trung gian và được cập nhật ngay khi thủ tục 3D_SR được thực thi. Tiếp theo, thủ tục 3D_SR sẽ phục dựng mỗi hướng d, trong đó lev < NLd ≤ NL với d là X, Y hoặc Z, bằng các thủ tục tương ứng HOR_SR, VER_SR và AXIAL_SR. Kết quả cuối cùng là băng con a(lev-1)[L|X][L|X][L|X](u,v,w). Hình D.4 mô tả chi tiết thủ tục 3D_SR.
Hình D.4 – Thủ tục 3D_SR
D.4.3 Thủ tục TO_ARRAY
Như mô tả trong Hình D.6, thủ tục TO_ARRAY thực hiện với tất cả các băng con của mức phân tách lev và hợp nhất chúng thành một mảng ba chiều a(u,v,w). Thủ tục này có đầu vào là các băng con alev[L|H|X][L|H|X][L|H|X](u,v,w) và khoảng hệ số theo chiều ngang, dọc và trục của băng con a(lev-1)[L|X][L|X][L|X](u,v,w) là u0,u1,v0,v1,w0 and w1. Mảng đầu ra có khoảng hệ số theo chiều ngang, dọc và trục là u0 ≤ u < u1, v0 ≤ v < v1 và w0 ≤ w < w1.
Hình D.5 – Các đầu vào và đầu ra của thủ tục TO_ARRAY
Hình D.6 – Các cấu hình băng con có thể đối với 3D DWT
D.4.4 Thủ tục 1D_INTERLEAVE
Như được thể hiện trên Hình D.7, thủ tục 1D_INTERLEAVE chèn các hệ số thông thấp và thông cao của biến đổi sóng con. Thủ tục này có đầu vào là một tín hiệu một chiều Y(n) và sắp xếp lại các giá trị hệ số trong tín hiệu bằng cách chèn chúng. Các giá trị của i0 và i1 tương ứng được sử dụng bởi thủ tục 1D_INTERLEAVE thể hiện sự bắt đầu và kết thúc của tín hiệu. Cách thức mà tín hiệu được chèn để hình thành đầu ra được mô tả bởi thủ tục 1D_INTERLEAVE, như trong Hình D.8.
Hình D.7 – Các tham số của thủ tục 1D_INTERLEAVE
Hình D.8 – Thủ tục 1D_INTERLEAVE
D.4.5 Thủ tục HOR_SR
Thủ tục HOR_SR thực hiện việc chèn và phục dựng băng con theo chiều ngang của mảng hệ số ba chiều. Thủ tục này có đầu vào là mảng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của màng là u0 ≤ u < u1, v0 ≤ v < v1 và w0 ≤ w < w1 (xem Hình D.9) và sinh ra đầu ra là một phiên bản lọc theo chiều ngang của mảng đầu vào cho từng hàng và từng lát ảnh.
Hình D.9 – Các đầu vào và đầu ra của thủ tục HOR_SR
Như thể hiện trên Hình D.10, thủ tục HOR_SR áp dụng việc phục dựng băng con một chiều (thủ tục 1D_SR) cho mỗi hàng của mảng đầu vào a(u,v,w), và khôi phục kết quả trở lại mỗi hàng.
Hình D.10 – Thủ tục HOR_SR
D.4.6 Thủ tục VER_SR
Thủ tục VER_SR thực hiện việc chèn và phục dựng băng con theo chiều dọc của mảng hệ số ba chiều. Thủ tục này có đầu vào là mảng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của màng là u0 ≤ u < u1, v0 ≤ v < v1 và w0 ≤ w < w1 (xem Hình D.11) và sinh ra đầu ra là phiên bản lọc theo chiều ngang của mảng đầu vào cho từng cột và từng lát ảnh.
Như được thể hiện trên Hình D.12, thủ tục VER_SR áp dụng việc phục dựng băng con một chiều (thủ tục 1D_SR) cho mỗi cột của mảng đầu vào a(u,v,w), và khôi phục kết quả trở lại mỗi cột.
Hình D.11 – Các đầu vào và đầu ra của thủ tục VER_SR
Hình D.12 – Thủ tục VER_SR
D.4.7 Thủ tục AXIAL_SR
Thủ tục AXIAL_SR thực hiện việc chèn và phục dựng băng con theo trục của mảng hệ số ba chiều. Thủ tục này có đầu vào là một mảng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của mảng là u0 ≤ u < u1, v0 ≤ v < v1 và w0 ≤ w < w1 (xem Hình D.13) và sinh ra đầu ra là phiên bản lọc theo chiều ngang của mảng đầu vào cho từng hàng và từng cột.
Như được mô tả trên Hình D.14, thủ tục AXIAL_SR áp dụng việc phục dựng băng con một chiều (thủ tục 1D_SR) cho mỗi chiều sâu của mảng đầu vào a(u,v,w), và khôi phục kết quả trở lại trong mỗi chiều sâu.
Hình D.13 – Các đầu vào và đầu ra của thủ tục AXIAL_SR
Hình D.14 – Thủ tục AXIAL_SR
D.4.8 Thủ tục 1D_SR
F.3.6 của ISO/IEC 15444-1 đã mô tả thủ tục 1D_SR được sử dụng để thực hiện phục dựng băng con. Ngoài ra, tất cả các thủ tục và mô tả tiếp theo, dù trực tiếp hoặc gián tiếp được yêu cầu bởi thủ tục 1D_SR, cũng đã được đề cập trong Phụ lục F của ISO/IEC 15444-1.
D.5 Biến đổi thuận (tham khảo)
D.5.1 Thủ tục FDWT (tham khảo)
Biến đổi sóng con rời rạc thuận (FDWT) biến đổi các mẫu khối ảnh-thành phần dịch mức DC l(x,y,z) thành một tập các băng con có các hệ số ab(ub,vb,wb) (thủ tục FDWT). Thủ tục FDWT (xem Hình D.15) có đầu vào là số lượng mức phân tách trong mỗi chiều của ba chiều và đã được báo hiệu trong các nhãn COD hoặc COC (xem A.2.2 và A.2.3).
Như trong F.4.1 của 1SO/IEC 15444-1 đã đề cập, thủ tục FDWT bắt đầu với việc khởi tạo biến lev (mức phân tách hiện tại) thành 1 và phân bổ mảng ba chiều l(x,y,z) vào băng con a0LLL(u0LLL,u1LLL,v0LLL,v1LLL,w0LLL,w1LLL). Thủ tục 3D_SD (xem D.5.2) được thực hiện tại mọi mức lev, trong đó mức Iev tăng thêm một ở mỗi lần lặp cho đến khi NL lần lặp hoàn tất. Thủ 3D_SD được lặp lại trên toàn băng con (lev-1)[L|X][L|X][L|X] được sinh ra tại mỗi lần lặp.
Toàn bộ thủ tục FDWT được mô tả chi tiết trên Hình D.16.
Tương tự với những gì đã được mô tả trong Phụ lục F của ISO/IEC 15444-1, các băng con được sinh ra sẽ được báo hiệu trong dòng mã theo thứ tự dưới đây:
NLLLL, NLXLL, NLLXL, NLLLX, NLLXX, NLXLX, NLXXL, NLHLL, NLHXL, NLHLX, NLHXX, NLLHL, NLXHL, NLLHX, NLXHX, NLHHL, NLHHX, NLLLH, NLXLH, NLLXH, NLXXH, NLHLH, NLHXH, NLLHH, NLXHH, NLHHH, (NL-1)HLL, (NL-1)HXL, (NL-1)HLX, (NL-1)HXX, (NL-1)LHL, (NL-1)XHL, (NL-1)LHX, …., 1XHX, 1HHL, 1HHX, 1LLH, 1XLH, 1LXH, 1XXH, 1HLH, 1HXH, 1LHH, 1XHH, 1HHH.
Lưu ý rằng, trong danh sách các băng con ở trên, chỉ các băng con tồn tại, có các tham số NLX, NLY và NLZ, là sẽ có mặt trong dòng mã. Đây là các băng con chính xác cần thiết để phục dựng đầy đủ khối ảnh-thành phần. Cũng lưu ý thêm rằng, NL[L|X][L|X][L|X] chỉ là băng con loại [L|X][L|X][L|X] đã được báo hiệu trong dòng mã.
Hình D.15 – Các đầu vào và đầu ra của thủ tục FDWT
Hình D.16 – Thủ tục FDWT
D.5.2 Thủ tục 3D_SD (tham khảo)
Thủ tục 3D_SD thực hiện việc phân tách mảng hệ số hoặc mẫu ba chiều a(lev-1)[L|X][L|X][L|X](u,v,w) thành nhiều nhóm các hệ số băng con alev[L|H|X][L|H|X][L|H|X](u,v,w), tùy thuộc vào số lượng phân tách NLX, NLY và NLZ.
Tổng số lượng hệ số của băng con (lev– 1)[L|X][L|X][L|X] bằng tổng các tổng số lượng hệ số của các băng con lev[L|H|X][L|H|X][L|H|X] sinh ra từ thủ tục 3D_SD.
Hình D.17 – Các đầu vào và đầu ra của thủ tục 3D_SD
Thủ tục 3D_SR (xem Hình D.18) phân tách mỗi hướng, d, trong đó mỗi hướng có lev < NLd ≤ NL, với d là X, Y hoặc Z, tương ứng bằng các thủ tục HOR_SD, VER_SD và AXIAL_SD. Tiếp theo, mảng ba chiều a(u,v,w) được chia thành các băng con được phục dựng khác nhau alev[L|H|X][L|H|X][L|H|X](u,v,w). Trong các băng con này, băng con lev[L|X][L|X][L|X] được sử dụng ở lần lặp tiếp theo của thủ tục FDWT để tiếp tục được phân tách (miễn sao có ít hơn NL lần lặp). Các băng con khác tiếp tục được xử lý để báo hiệu trong dòng mã.
Hình D.18 – Thủ tục 3D_SD
D.5.3 Thủ tục TO_SUBBANDS (tham khảo)
Thủ tục TO_SUBBANDS có đầu vào là mảng ba chiều a(u,v,w) và đầu ra là các băng con sau khi đã được hoàn lại, như được mô tả trong Hình D.6. Mảng a(u,v,w) có khoảng hệ số theo chiều ngang, dọc và trục là u0 ≤ u < u1, v0 ≤ v < v1 và w0 ≤ w < w1.
D.5.4 Thủ tục AXIAL_SD (tham khảo)
Thủ tục AXIAL_SD thực hiện việc phân tách băng con của mảng hệ số ba chiều theo trục. Thủ tục này có đầu vào là mảng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của mảng là u0 ≤ u < u1, v0 ≤ v < v1 và w0 ≤ w < w1 (xem Hình D.19) và sinh ra đầu ra là phiên bản lọc theo trục của mảng đầu vào, cho từng hàng và từng cột. Sau phân tách là quá trình giải lặp.
Như được mô tả trên Hình D.20, thủ tục AXIAL_SD áp dụng việc phân tách băng con một chiều (thủ tục 1D_SD) cho mỗi chiều sâu của mảng đầu vào a(u,v,w), và khôi phục kết quả ở lại cho mỗi chiều sâu.
Hình D.19 – Các đầu vào và đầu ra của thủ tục AXIAL_SD
Hình D.20 – Thủ tục AXIAL_SD
D.5.5 Thủ tục VER_SD (tham khảo)
Thủ tục VER_SD thực hiện việc phân tách băng con của mảng hệ số ba chiều theo chiều dọc. Thủ tục này có đầu vào là mảng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của mảng là u0 ≤ u < u1, v0 ≤ v < v1 và w0 ≤ w < w1 (xem Hình D.21) và sinh ra đầu ra là một phiên bản lọc theo chiều dọc của mảng đầu vào, cho từng cột và từng lát ảnh. Sau phân tách là quá trình giải chèn.
Như được mô tả trên Hình D.22, thủ tục VER_SD áp dụng việc phân tách băng con một chiều (thủ tục 1D_SD cho mỗi cột của mảng đầu vào a(u,v,w), và khôi phục kết quả trở lại trong mỗi cột.
Hình D.21 – Các đầu vào và đầu ra của thủ tục VER_SD
Hình D.22 – Thủ tục VER_SD
D.5.6 Thủ tục HOR_SD (tham khảo)
Thủ tục HOR_SD thực hiện việc phân tách băng con của mảng hệ số ba chiều theo chiều ngang. Thủ tục này có đầu vào là mảng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của mảng là u0 ≤ u < u1, v0 ≤ v < v1 và w0 ≤ w < w1 (xem Hình D.23) và sinh ra đầu ra là một phiên bản lọc theo chiều ngang của mảng đầu vào, cho từng hàng và từng lát ảnh. Sau phân tách là quá trình giải chèn.
Như được mô tả trên Hình D.24, thủ tục HOR_SD áp dụng việc phân tách băng con một chiều (thủ tục 1D_SD) lên mỗi hàng của mảng đầu vào a(u,v,w), và khôi phục kết quả trở lại trên mỗi hàng.
Hình D.23 – Các đầu vào và đầu ra của thủ tục HOR_SD
Hình D.24 – Thủ tục HOR_SD
D.5.7 Thủ tục 1D_DEINTERLEAVE (tham khảo)
Như được mô tả trên Hình D.25, thủ tục 1D_DEINTERLEAVE giải chèn các hệ số thông thấp và thông cao của biến đổi sóng con. Thủ tục này có đầu vào là tín hiệu một chiều, X(n), và sắp xếp lại các giá trị hệ số trong tín hiệu bằng cách giải chèn chúng. Các giá trị của i0 và i1 tương ứng được sử dụng bởi thủ tục 1D_DEINTERLEAVE thể hiện sự bắt đầu và kết thúc của tín hiệu. Cách thức mà tín hiệu được giải chèn để hình thành đầu ra được mô tả bởi thủ tục 1D_DEINTERLEAVE như trên Hình D.26.
Hình D.25 – Các tham số của thủ tục 1D_DEINTERLEAVE
Hình D.26 – Thủ tục 1D_DEINTERLEAVE
D.5.8 Thủ tục 1D_SD (tham khảo)
F.4.6 của ISO/IEC 15444-1 đã mô tả thủ tục 1D_SD được sử dụng để thực hiện việc phân tách băng con. Ngoài ra, tất cả các thủ tục và đặc tả tiếp theo, dù trực tiếp hoặc gián tiếp cần cho thủ tục 1D_SD, cũng đã được cho trong Phụ lục F của ISO/IEC 15444-1.
Phụ lục E
(Quy định)
Lượng tử hóa
E.1 Giới thiệu
Trong phụ lục này và các điều nhỏ của phụ lục, các lưu đồ và bảng chỉ có tính bắt buộc khi chúng chỉ rõ đầu ra mà các triển khai khác phải tuân thủ. Phụ lục này quy định các khía cạnh liên quan đến sự lượng tử hóa của các hệ số biến đổi khối ảnh-thành phần. Các khía cạnh lượng tử hóa đã được chỉ rõ trong Phụ lục E của ISO/IEC 15444-1, nhưng sẽ được mở rộng để định nghĩa sự lượng tử hóa các phân tách ba chiều trong tiêu chuẩn này.
E.2 Các biến thể của thủ tục lượng tử hóa nghịch
Thủ tục lượng tử hóa sẽ phải giống như đã quy định trong Phụ lục E của ISO/IEC 15444-1, ngoại trừ những sửa đổi ở đây nhằm phù hợp với các cấu trúc phân tách ba chiều của tiêu chuẩn này.
Các băng con cũng giống như đã được chỉ rõ trong Phụ lục E của ISO/IEC 15444-1, ngoại trừ việc có nhiều băng con hơn cho các phân tách ba chiều (tức là, [L|X|H][L|X|H][L|X|H] trừ XXX).
Các độ lợi băng con được chỉ rõ trong Bảng E.1 dưới đây thay cho Bảng E.1 của ISO/IEC 15444-1.
Bảng E.1 – Độ lợi băng con
Loại băng con |
Độ lợib |
log2(độ lợib) |
LLL, LXX, XLX, XXL, LXL, LLX, XLL |
1 |
0 |
H[L|X][L|X], [L|X]H[L|X], [L|X][L|X]H |
2 |
1 |
HH[L|X], H[L|X]H, [L|X]HH |
4 |
2 |
HHH |
8 |
3 |
Đối với các cấu trúc phân tách ba chiều như đã được xác định trong tiêu chuẩn này, giá trị nb trong Công thức E-5 của ISO/IEC 15444-1 biểu thị số lượng mức phân tách lớn nhất trong mỗi hướng không gian từ khối ảnh-thành phần ban đầu đến băng con b (tức là, nb = max(nxb, nyb, nzb), với nxb, nyb và nzb được xác định bởi Công thức B-13).
Phụ lục F
(Quy định)
Mã hóa ảnh theo vùng quan tâm, phần mở rộng
F.1 Giới thiệu
Trong phụ lục này và các điều nhỏ của phụ lục, các lưu đồ và bảng chỉ có tính bắt buộc khi chúng chỉ rõ đầu ra mà các triển khai khác phải tuân thủ. Phụ lục này mô tả phần mở rộng khối của mã hóa theo vùng quan tâm cho cả Phụ lục H của ISO/IEC 15444-1 và Phụ lục L của T.801 | ISO/IEC 15444-2.
Phụ lục này mô tả công nghệ vùng quan tâm (ROI) ba chiều. ROI là một phần của ảnh và được mã hóa với độ trung thực cao hơn phần còn lại của ảnh (ảnh nền). Sự mã hóa cũng được thực hiện theo cách thức sao cho thông tin liên quan đến ROI sẽ đến trước thông tin liên quan đến ảnh nền.
F.2 Giải mã ROI
Các thủ tục được chỉ rõ trong điều này được áp dụng chỉ trong trường hợp có mặt đoạn nhãn RGN (xem A.2.4), tức là thể hiện sự có mặt của ROI được mã hóa bằng phương pháp dựa trên Maxshift hoặc Scaling.
F.2.1 Giải mã ROI bằng phương pháp Maxshift
Thủ tục này tổ chức lại các bit có trọng số của các hệ số ROI và các hệ số ảnh nền. Thủ tục thực hiện theo các bước sau:
1) Nhận giá trị phân cấp, s, từ tham số SPrgn của đoạn nhãn RGN trong dòng mã (xem A.2.4). Các bước tiếp theo (2, 3 và 4) được áp dụng cho từng hệ số của băng con b.
2) Nếu Nb(u,v,w) < Mb (xem các định nghĩa của Nb trong D.2.1 của ISO/IEC 15444-1 và Mb trong Công thức E-2 của ISO/IEC 15444-1), thì sẽ không có sửa đổi nào được thực hiện.
3) Nếu Nb(u,v,w) ≥ Mb và nếu ít nhất có một trong số Mb MSB đầu tiên (i = 1,…, Mb) khác không, thì giá trị của Nb(u,v,w) được cập nhật thành Nb(u,v,w) = Mb.
4) Nếu Nb(u,v,w) ≥ Mb và nếu tất cả Mb MSB đầu tiên bằng 0, thì thực hiện các sửa đổi sau:
i) loại bỏ s MSB đầu tiên và dịch các MSB còn lại thêm s vị trí, như được mô tả trong Công thức F-1, với i = 1,…, Mb
(F-1)
ii) cập nhật giá trị của Nb(u,v,w) như cho bởi công thức sau:
Nb(u,v,w) = max(o,Nb(u.v.w) – s) (F-2)
F.2.2 Giải mã ROI bằng phương pháp Scaling
Thủ tục này tổ chức lại các bit trọng số của các hệ số ROI và các hệ số ảnh nền. Thủ tục này thực hiện theo các bước sau:
1) Nhận thông tin kiểu tương ứng và giá trị phân cấp, s, từ đoạn nhãn RGN cho từng ROI. Sau đó, các bước từ 2 đến 6 được áp dụng cho từng hệ số (u,v,w) của băng con b.
2) Tạo mặt nạ ROI {Mi(u,v,w)} cho tất cả ROI, xem F.4.2 để có thông tin chi tiết về cách tạo mặt nạ ROI.
3) Đối với mỗi khối mã, tìm giá trị phân cấp lớn nhất smax cho từng hệ số (u,v,w).
4) Đối với mỗi hệ số trong từng khối mã, tìm giá trị phân cấp cao nhất và đặt s(u,v,w) là:
s(u,v,w) = smax – max(si – Mi (u,v,w)) (F-3)
Với i = 0…(số lượng ROI -1).
5) Đối với mỗi hệ số (u,v,w), loại bỏ s(u,v,w) MSB đầu tiên và dịch các MSB còn lại thêm s(u,v,w) vị trí, như được mô tả trong Công thức F-4, với i = 1,…, Mb:
(F-4)
6) Cập nhật giá trị của Nb(u,v,w) như cho trong Công thức F-5:
Nb(u,v,w) = max(0,Nb (u.v.w) – s(u,v,w)) (F-5)
F.3 Mã hóa ROI (tham khảo)
Điều này mô tả cách thức mã hóa ảnh có một hoặc nhiều ROI bằng phương pháp dựa trên Maxshift hoặc Scaling. Mã hóa được mô tả ở đây chỉ là thông tin tham khảo. Ở phía bộ mã hóa, mặt nạ ROI được tạo ra thể hiện các hệ số biến đổi lượng tử hóa phải được mã hóa với chất lượng tốt nhất (gần như không tổn thất). Mặt nạ ROI là một bản đồ bit mô tả các hệ số này.
F.3.1 Mô tả phương pháp Maxshift (tham khảo)
Các hệ số biến đổi được lượng tử nằm ngoài mặt nạ ROI, được gọi là các hệ số ảnh nền, được phân cấp giảm dần sao cho các bit liên quan đến ROI đều được đặt trong các mặt phẳng bit cao hơn so với ảnh nền. Điều này nghĩa là khi bộ mã hóa và giải mã entropy mã hóa các hệ số biến đổi được lượng tử thì các mặt phẳng bit liên quan đến ROI sẽ được mã hóa trước thông tin liên quan đến ảnh nền. Xem F.4.1 về tạo mặt nạ ROI bằng phương pháp Maxshift.
Phương pháp Maxshift có thể còn được mô tả bằng các bước sau:
1) Tạo mặt nạ ROI, M(x, y, z), xem F.4.1.
2) Tìm giá trị phân cấp s (xem F.3.2).
3) Cộng s LSB vào mỗi hệ số |qb(u,v,w)|. Số lượng mặt phẳng bit biên độ M’b khi đó sẽ là:
M’b = Mb + s (F-6)
Với Mb được cho bởi Công thức E-2 của ISO/IEC 15444-1 và giá trị mới của mỗi hệ số sẽ được cho bởi:
│qb(u,v,w)│ = │qb(u,v,w)│. 2S (F-7)
4) Giảm tất cả các hệ số ảnh nền được cho bởi M(x,y,z) sử dụng giá trị phân cấp s (xem F.3.2). Do đó, nếu │qb(u,v,w)│ là hệ số ảnh nền được cho bởi M(x, y, z), thì:
(F-8)
5) Viết giá trị phân cấp s vào dòng mã sử dụng tham số SPrgn của đoạn nhãn RGN.
Sau các bước này thì các hệ số biến đổi được lượng tử đã được mã hóa entropy như bình thường.
F.3.2 Lựa chọn giá trị phân cấp, s, cho phương pháp Maxshift tại phía bộ mã hóa (tham khảo)
Giá trị phân cấp, s, có thể được lựa chọn sao cho Công thức F-9 đúng với đối với mọi hệ số hình nền, qBG(x,y,z), ở mọi khối mã trong thành phần hiện tại, với max(Mb) là số lượng mặt phẳng bit biên độ lớn nhất (xem Công thức E-1 của ISO/IEC 15444-1).
s ≥ max(Mb) (F-9)
Điều này đảm bảo rằng giá trị phân cấp được sử dụng sẽ đủ lớn để đảm bảo rằng tất cả các bit có trọng số liên quan đến ROI sẽ nằm trong mặt phẳng bit cao hơn so với tất cả các bit có trọng số liên quan đến ảnh nền.
F.3.3 Mô tả phương pháp dựa trên Scaling (tham khảo)
Như đã đề cập trong phần giới thiệu của F.3, phần mô tả mã hóa ROI chỉ có tính chất tham khảo. Tuy nhiên, khi sử dụng phương pháp ROI dựa trên Scaling, sự thất bại trong việc tạo mặt nạ ROI chính xác ở phía bộ mã hóa sẽ làm giảm đáng kể chất lượng ảnh được mã hóa và sẽ gây tổn thất khi giải mã. Xem F.4.2 về việc tạo mặt nạ ROI bằng phương pháp dựa trên Scaling.
Các hệ số biến đổi được lượng tử sẽ được phân cấp theo cách thức sao cho trọng số tương đối của mỗi hệ số biến đổi bằng với giá trị một phân cấp nhất định, s, của ROI mà chúng được áp dụng. Nếu một hệ số biến đổi lại thuộc một vài ROI thì giá trị s lớn nhất sẽ được lựa chọn. Nếu một hệ số biến đổi thuộc ảnh nền thì giá trị phân cấp s bằng 0. Trước khi phân cấp các hệ số biến đổi được lượng tử hóa của một khối mã thì phải tìm giá trị phân cấp lớn nhất SMax và nhỏ nhất sMin đối với khối mã.
Xét hệ số biến đổi được lượng tử, qb(u,v,w), trong khối mã hiện tại có giá trị phân cấp tương ứng, s, (với sMin < s ≤ sMax). Sau khi phân cấp, các bit riêng lẻ của qb(u,v,w) kết thúc abs(sMax – s) mặt phẳng bit thấp hơn các bit tương ứng của hệ số có s = sMax. Số lượng bit biên độ cho khối mã này do đó sẽ tăng thêm (sMax – sMin).
Do các khối mã được xử lý độc lập nên các hệ số biến đổi được lượng tử thuộc về cùng một ROI có thể kết thúc mà có các mức trọng số khác nhau trong các khối mã khác nhau. Sự chênh lệch này giữa các khối mã phải được cân nhắc bởi bộ phân bổ tốc độ. Một ví dụ về việc này là nếu toàn bộ một khối mã thuộc ảnh nền và một khối mã khác lại có cả các hệ số ROI và ảnh nền. Trong trường hợp này, các hệ số ảnh nền trong khối mã thứ hai phải được dịch lại s0 bước, còn trong khối mã thứ nhất không phải dịch. Khi đó, thuật toán phân bổ tốc độ sẽ quyết định việc đảm bảo rằng các mặt phẳng bit từ hai khối mã đều được đưa vào dòng bit theo thứ tự đúng.
Khi bộ mã hóa và giải mã entropy mã hóa các hệ số biến đổi được lượng tử thì các mặt phẳng bit liên quan đến ROI sẽ được mã hóa trước hoặc cùng thời điểm với thông tin liên quan đến ảnh nền. Giá trị phân cấp, si, cho mỗi ROI được quy định bởi người dùng hoặc ứng dụng.
Phương pháp này có thể được mô tả bằng các bước sau cho tập gồm n ROI:
– Với mỗi khối mã trong mỗi thành phần:
1) Tạo mặt nạ ROI cho toàn bộ ROI i, {Mi(u,v,w)}, xem F.4.2.
2) Tìm sMin and sMax, với sMin và sMax tương ứng là các giá trị phân cấp nhỏ nhất và lớn nhất trong khối mã hiện tại.
3) Cộng sBlock = sMax – sMin LSB vào mỗi hệ số |qb(u,v,w)|. Số lượng mặt phẳng bit biên độ M’b đối với băng b khi đó sẽ là:
M’b = Mb + sBlock (F-10)
với Mb được cho bởi Công thức E-2 của ISO/IEC 15444-1 và giá trị mới của mỗi hệ số sẽ được cho bởi:
(F-11)
4) Đối với mỗi hệ số trong từng khối mã, tìm giá trị phân cấp cao nhất và đặt s(u,v,w) thành:
s(u,v,w) = smax – max(si – Mi(u,v,w)) (F-12)
với i = 0 … (số lượng ROI – 1).
5) Giảm dần tất cả các hệ số sao cho:
(F-13)
6) Đối với mỗi ROI, viết giá trị phân cấp s, kiểu, và các điểm tham chiếu vào dòng mã sử dụng đoạn nhãn RGN như được mô tả trong A.2.4.
F.4 Tạo mặt nạ vùng quan tâm
Để có được một ROI có chất lượng tốt hơn so với phần còn lại của ảnh mà vẫn duy trì được độ nén phù hợp thì các bít cần được tiết kiệm bằng cách gửi ít thông tin về ảnh nền. Để làm việc này thì mặt nạ ROI sẽ được tính toán. Mặt nạ này là một mặt phẳng bit chỉ ra một tập các hệ số biến đổi được lượng tử mà sự mã hóa chúng là đủ cho bộ thu phục dựng vùng mong muốn với chất lượng tốt hơn so với ảnh nền (gần như không tổn thất).
Để thể hiện khái niệm về việc tạo mặt nạ ROI, xét một ROI đơn và một thành phần khối đơn, và xác định các mẫu thuộc ROI đó trong miền khối cho bởi mặt nạ nhị phân, M(x, y, z), với:
hệ số sóng con (x,y,z) được yêu cầu |
(F-14) |
|
độ chính xác trên (x,y,z) có thể thoải mãn mà không ảnh hưởng đến ROI |
Mặt nạ là bản đồ của ROI trong miền sóng con sao cho chúng có giá trị khác 0 trong ROI và bằng 0 ngoài ROI. Trong mỗi bước, mỗi băng con của mặt nạ khi đó sẽ được cập nhật theo thứ tự quét mành. Mặt nạ khi đó sẽ chỉ ra các hệ số nào được yêu cầu tại bước này sao cho sự biến đổi nghịch sẽ cho lại các hệ số của mặt nạ trước đó.
Ví dụ, bước cuối cùng của biến đổi nghịch là bước hợp nhất hai băng con thành một. Để đến được bước này thì phải tìm được các hệ số của cả hai băng con. Bước trước đó là bước hợp nhất bốn băng con thành hai băng. Để đến được bước này thì phải tìm được các hệ số trong bốn băng con cần để phục dựng các hệ số có trong mặt nạ của hai băng con đó một cách hoàn hảo. Cũng như vậy, bước trước đó là bước hợp nhất tám băng con thành bốn băng con. Lại một lần nữa, để đến được bước này thì phải tìm được các hệ số trong tám băng con cần cho tất cả bốn băng con này.
Tất cả các bước sau đó đều được thực hiện ngược lại để cho ra mặt nạ. Nếu các hệ số tương ứng với mặt nạ được phát đi và thu lại, và sự biến đổi nghịch đã được tính toán trên các hệ số này thì ROI mong muốn sẽ được phục dựng với chất lượng tốt hơn so với phần còn lại của khối (gần như không tổn thất nếu các hệ số ROI đều được mã hóa không tổn thất).
F.4.1 Tạo mặt nạ vùng quan tâm cho phương pháp Maxshift (tham khảo)
Phần dưới đây mô tả cách thức mở rộng mặt nạ bằng các bộ lọc khác nhau. Các phương pháp tương tự có thể được sử dụng đối với các bộ lọc khác.
F.4.1.1 Tạo mặt nạ vùng quan tâm bằng bộ lọc thuận nghịch 5-3 (tham khảo)
Để có được một tập tối ưu các tham số được lượng tử để tiến hành phân cấp thì cần sử dụng các công thức đã được mô tả trong điều này.
Biến đổi sóng con nghịch đã được sử dụng để tìm ra các hệ số cần có trong mặt nạ. Công thức F-5 và F-6 của ISO/IEC 15444-1 cho các hệ số cần để phục dựng X(2n) và X(2n + 1) mà không tổn thất. Có thể thấy ngay rằng đó là L(n), L(n + 1), H(n – 1), H(n), H(n + 1) (xem Hình H.1 của ISO/IEC 15444-1). Do vậy, nếu X(2n) và X(2n + 1) nằm trong ROI thì các hệ số băng con thấp và cao ở trên đều có trong mặt nạ. Lưu ý rằng X(2n) và X(2n +1) tương ứng là các điểm có chỉ số chẵn và lẻ, liên quan đến gốc lưới tọa độ tham chiếu.
F.4.1.2 Tạo mặt nạ vùng quan tâm bằng bộ lọc không thuận nghịch 9-7 (tham khảo)
Sự giải mã thành công không phụ thuộc vào việc lựa chọn các mẫu để tiến hành phân cấp. Để có được tập tối ưu các hệ số được lượng tử để tiến hành phân cấp thì cần sử dụng các công thức đã được mô tả trong điều này.
Để tìm được các hệ số cần có trong mặt nạ thì biến đổi sóng con nghịch đã được sử dụng như trong H.3.1.1 của ISO/IEC 15444-1. Điều này đã được mô tả trong Hình H.2. X(2n) và X(2n + 1) tương ứng là các điểm có chỉ số chẵn và lẻ, liên quan đến gốc lưới tọa độ tham chiếu.
Có thể thấy ngay rằng, các hệ số cần để phục dựng X(2n) và X(2n + 1) mà không tổn thất là L(n – 1) đến L(n + 2) và H(n – 2) đến H(n + 2). Do đó, nếu X(2n) và X(2n + 1) đều nằm trong ROI thì các hệ số băng con thấp và cao này đều nằm trong mặt nạ.
F.4.2 Tạo mặt nạ vùng quan tâm bằng phương pháp dựa trên Scaling
Dưới đây là những mô tả về cách thức mở rộng mặt nạ cho trường hợp hình khối và hình Elipxoit và cách thức thực hiện với các bộ lọc khác nhau. Các phương pháp tương tự có thể được sử dụng đối với các bộ lọc khác.
F.4.2.1 Tạo mặt nạ hình khối trên lưới tọa độ tham chiếu
Mặt nạ hình khối được mô tả trong điều này được tạo trên lưới tọa độ tham chiếu. Khi được tạo trên lưới tọa độ tham chiếu, phương pháp được mô tả trong F.4.2.3 được sử dụng để tạo mặt nạ trong miền sóng con. Một hình khối được mô tả bởi sáu tham số, xem Hình F.1, tất cả đều được báo hiệu trong nhãn RGN (xem A.2.4). Các tham số gồm (XArgn, YArgn, ZArgn, XBrgn, YBrgn, ZBrgn), với XArgn, YArgn và ZArgn là độ lệch x, y và z của góc trên bên trái mặt trước của hình khối từ gốc lưới tọa độ tham chiếu, trong đó XBrgn, YBrgn và ZBrgn tương ứng là chiều rộng, chiều cao và chiều sâu của hình khối.
Mặt nạ đúng của lưới tọa độ tham chiếu được cho bởi Công thức F-15.
XArgn ≤ x ≤ XArgn + XBrgn
YArgn ≤ y ≤ YArgn + YBrgn ZArgn ≤ z ≤ ZArgn + ZBrgn |
(F-15) |
Hình F.1 – Mặt nạ hình khối trên lưới tọa độ tham chiếu
F.4.2.2 Tạo mặt nạ Elipxoit trên lưới tọa độ tham chiếu
Mặt nạ Elipxoit mô tả trong phần này được tạo trên lưới tọa độ tham chiếu. Khi được tạo trên lưới tọa độ tham chiếu, phương pháp được mô tả trong F.4.2.3 được sử dụng để tạo mặt nạ trong miền sóng con. Hình Elipxoit được mô tả bởi sáu tham số, xem Hình F.2, tất cả các tham số đều được báo hiệu trong nhãn RGN (xem A.2.4). Các tham số gồm (XArgn, YArgn, ZArgn, XBrgn, YBrgn, ZBrgn), với XArgn, YArgn và ZArgn là độ lệch x, y và z của tâm hình Elipxoit từ gốc lưới tọa độ tham chiếu, trong đó XBrgn, YBrgn và ZBrgn tương ứng là chiều rộng, chiều cao và chiều sâu của hình Elipxoit.
Mặt nạ đúng của lưới tọa độ tham chiếu được cho bởi Công thức F-16.
(F-16)
Hình F.2 – Mặt nạ Elipxoit trên lưới toạn độ tham chiếu
F.4.2.3 Tạo nhanh mặt nạ hình khối (tham khảo)
Trong trường hợp ROI hình khối thì mặt nạ có thể được tạo nhanh hơn so với các kiểu nhị phân. Trong trường hợp này, thay vì phải tìm ra cách thức phục dựng từng hệ số và giá trị voxel theo biến đổi nghịch thì chỉ cần xem xét hai vị trí, đó là góc trên bên trái mặt trước và góc dưới bên phải mặt sau của mặt nạ. Góc trước bên trái cao nhất (x1,y1,z1) trên lưới tọa độ tham chiếu sẽ được cho trong đoạn nhãn RGN là (XArgn, YArgn, ZArgn), trong đó góc sau bên phải thấp nhất (x2,y2,z2) trên lưới tọa độ tham chiếu sẽ được cho bởi các tham số trong đoạn nhãn RGN là (XArgn + XBrgn – 1), (YArgn + YBrgn – 1), (ZArgn + ZBrgn – 1).
Việc tạo mặt nạ cũng phải xem xét xem loại bộ lọc nào đã được sử dụng cho biến đổi.
Trong mỗi mức phân tách, các bước được mô tả ở phần trước được thực hiện để xem mặt nạ được mở rộng như thế nào. Xét một mặt nạ 1D cần được phân tách, Rext, và đặt x1 và x2 là các chỉ số thấp nhất và cao nhất của các mẫu khác 0 trong Rext.
1) Với mỗi bước nâng s với s trong dải từ 0 đến NLS – 1:
i) Tìm chỉ số mẫu thấp nhất (2n +ms ≥ x1) nằm trong mặt nạ
(F-17)
nếu (x’1 > x1) thì x’1 = x1 (F-18)
ii) Tìm chỉ số mẫu cao nhất (2n + ms ≤ x2)
(F-19)
nếu (x’2 > x2) thì x’2 = x2 (F-20)
iii) Đặt x1 = x’1, x2 = x’2 với ms = 1 – ms-1 chỉ ra rằng bước nâng thứ s áp dụng cho các hệ số có chỉ số chẵn (ms = 0) hay cho các hệ số có chỉ số lẻ (ms = 1), và với Ls là số lượng hệ số nâng cho bước nâng s.
Đặt tất cả các mẫu giữa x1 và x2, kể cả tại x1 và x2, là khác 0 và sau đó sử dụng thủ tục giải chèn được mô tả trong F.4.5 của ISO/IEC 15444-1 để phân chia các mẫu mặt nạ ROI thành các băng con theo cách các hệ số sóng con được phân chia.
F.5 Các lưu ý về mã hóa vùng quan tâm
F.5.1 Cách sử dụng các phương pháp Scaling và Maxshift
Không được sử dụng phương pháp Maxshift cùng với phương pháp dựa trên Scaling và ngược lại.
F.5.2 Lưu ý về đa thành phần (tham khảo)
Đối với trường hợp các ảnh màu thì áp dụng phương pháp này riêng cho từng thành phần màu. Nếu một vài thành phần màu bị giảm kích thước thì mặt nạ cho các thành phần giảm kích thước sẽ được thiết lập theo như cách với mặt nạ của các thành phần không bị giảm kích thước.
F.5.3 Lưu ý về độ chính xác trong triển khai (tham khảo)
Trong một vài trường hợp, phương pháp mã hóa ROI này có thể làm vượt quá dải động. Tuy nhiên, vấn đề này dễ dàng được giải quyết bằng cách đơn giản là loại bỏ bớt các mặt phẳng bit có ý nghĩa thấp nhất hiện đang vượt quá giới hạn do quá trình giảm kích thước. Tác động của việc này sẽ làm ROI có chất lượng tốt hơn so với ảnh nền, cho dù là toàn bộ dòng bit đã được giải mã. Tuy nhiên, điều này có thể lại gây nên các vấn đề nếu ảnh được mã hóa với ROI theo kiểu không tổn thất. Việc loại bỏ các mặt phẳng bit có ý nghĩa thấp nhất đối với ảnh nền có thể lại làm cho ảnh nền không được mã hóa không tổn thất, và trường hợp tồi nhất là ảnh nền có thể không hề được phục dựng. Điều này sẽ tùy thuộc vào dải động.
Phụ lục G
(Tham khảo)
Các ví dụ và hướng dẫn, phần mở rộng
G.1 Mô hình hóa tốc độ méo
Xem J.14 của ISO/IEC 15444-1.
Thư mục tài liệu tham khảo
[1] Morton, G.M. (1966), A Computer Oriented Geodetic Data Base and a New Technique in File Sequencing, IBM Ltd, Ottawa, Canada.
[2] Taubman, D., Marcellin, M.W. (2001), JPEG2000- Image Compression: Fundamentals, Standards and Practice, Hingham, MA: Kluwer Academic Publishers.
[3] Schelkens, P. (2001), Multidimensional wavelet coding- algorithms and implementations, PhD Thesis, Department of Electronics and Information Processing (ETRO), Vrije Universiteit Brussel, Brussel.
[4] Schelkens, P., Munteanu, A., Barbarien, J., Galca, M., Giro i Nieto, X., and Cornelis, J. (2003), Wavelet Coding of Volumetric Medical Datasets, IEEE Transactions on Medical Imaging, Vol. 22, pp. 441-458.
[5] Schelkens, P., Skodras, A., Ebrahimi, T., et al. (2009), The JPEG 2000 Suite, John Wiley & Sons, Ltd.
MỤC LỤC
1 Phạm vi áp dụng
2 Tài liệu viện dẫn
3 Thuật ngữ và định nghĩa
4 Thuật ngữ viết tắt
5 Ký hiệu (và thuật ngữ viết tắt)
6 Mô tả chung
Phụ lục A (Quy định) Cú pháp dòng mã, phần mở rộng
Phụ lục B (Quy định) Ảnh và xếp thứ tự dữ liệu ảnh nén, phần mở rộng
Phụ lục C (Quy định) Mô hình hóa bit hệ số
Phụ lục D (Quy định) Biến đổi sóng con rời rạc của các khối ảnh – thành phần
Phụ lục E (Quy định) Lượng tử hóa
Phụ lục F (Quy định) Mã hóa ảnh theo vùng quan tâm, phần mở rộng
Phụ lục G (Tham khảo) Các ví dụ và hướng dẫn, phần mở rộng
Thư mục tài liệu tham khảo
TIÊU CHUẨN QUỐC GIA TCVN 11777-10:2017 (ISO/IEC 15444-10:2011) VỀ CÔNG NGHỆ THÔNG TIN – HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG 2000 – PHẦN MỞ RỘNG ĐỐI VỚI DỮ LIỆU BA CHIỀU | |||
Số, ký hiệu văn bản | TCVN11777-10:2017 | Ngày hiệu lực | |
Loại văn bản | Tiêu chuẩn Việt Nam | Ngày đăng công báo | |
Lĩnh vực |
Giao dịch điện tử |
Ngày ban hành | 01/01/2017 |
Cơ quan ban hành | Tình trạng | Còn hiệu lực |
Các văn bản liên kết
Văn bản được hướng dẫn | Văn bản hướng dẫn | ||
Văn bản được hợp nhất | Văn bản hợp nhất | ||
Văn bản bị sửa đổi, bổ sung | Văn bản sửa đổi, bổ sung | ||
Văn bản bị đính chính | Văn bản đính chính | ||
Văn bản bị thay thế | Văn bản thay thế | ||
Văn bản được dẫn chiếu | Văn bản căn cứ |