TIÊU CHUẨN QUỐC GIA TCVN 11777-10:2017 (ISO/IEC 15444-10:2011) VỀ CÔNG NGHỆ THÔNG TIN – HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG 2000 – PHẦN MỞ RỘNG ĐỐI VỚI DỮ LIỆU BA CHIỀU

Hiệu lực: Còn hiệu lực

TIÊU CHUẨN VIỆT NAM

TCVN 11777-10:2017

ISO/IEC 15444-10:2011

CÔNG NGHỆ THÔNG TIN – HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG 2000 – PHẦN MỞ RỘNG ĐỐI VỚI DỮ LIỆU BA CHIỀU

Information technology – JPEG 2000 image coding system: Extensions for three-dimensional data

Lời nói đầu

TCVN 11777-10:2017 hoàn toàn tương đương với ISO/IEC 15444-10:2011.

TCVN 11777-10:2017 do Học viện Công nghệ Bưu chính Viễn thông biên soạn, Bộ Thông tin và Truyền thông đề nghị, Tng cục Tiêu chuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ công b.

 

CÔNG NGHỆ THÔNG TIN – HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG 2000 – PHẦN MỞ RỘNG ĐI VỚI DỮ LIỆU BA CHIỀU

Information technology – JPEG 2000 image coding system – Extensions for three-dimensional data

 

1  Phạm vi áp dụng

Tiêu chuẩn này cung cp phần m rộng cho hệ thống mã hóa lõi (ISO/IEC 15444-1) và phần m rộng (ISO/IEC 15444-2) đối với các tập dữ liệu dạng khối logic. Cụ thể là, tiêu chuẩn vẫn duy trì tất cả các tính năng hiện tại và cú pháp của ISO/IEC 15444-1, và một phần tính năng hiện tại của ISO/IEC15444-2 đối với các ảnh đa thành phần, bên cạnh đó cung cấp các tùy chọn và m rộng cho một số các tính năng này. Trong các nội dung này, tiêu chuẩn đưa ra đặc tả đẳng hướng cho các tập dữ liệu ba chiều, tức là, đưa ra các tính năng xử lý đồng nhất  tất c ba chiều thậm chí cả khi cú pháp dòng mã của ISO/IEC 15444-1 và ISO/IEC 15444-2 khác nhau giữa hai trục không gian và trục thành phần chéo. Các mô hình ngữ cảnh được sử dụng trong tiêu chuẩn này giống các mô hình ngữ cảnh trong ISO/IEC 15444-1 và ISO/IEC 15444-2. Các mô hình ngữ cảnh cải tiến sẽ được giới thiệu trong tài liệu bổ sung.

2  Tài liệu viện dẫn

Các tài liệu viện dẫn sau đây là cần thiết đ áp dụng tiêu chuẩn này. Đối vi các tài liệu viện dẫn ghi năm công bố thì áp dụng phiên bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất (bao gồm c các sửa đổi, bổ sung).

ISO/IEC 15444-1:2004, Công nghệ thông tin – Hệ thống mã hóa hình ảnh JPEG 2000: Hệ thống mã hóa lõi (Information technology – JPEG 2000 image coding system: Core coding system).

ISO/IEC 15444-2:2004, Công nghệ thông tin – Hệ thống mã hóa hình ảnh JPEG 2000: Phần m rộng. (Information technology- JPEG 2000 image coding system: Extensions).

3  Thuật ngữ và định nghĩa

Tiêu chuẩn này sử dụng các thuật ngữ và định nghĩa sau:

3.1

Khối bit 3D (3D bit-block)

Mng ba chiều của các bit. Trong tiêu chun này, khối bit 3D nói đến tất cả các bit có cùng biên độ  mọi hệ số hoặc mẫu. Thuật ngữ này có thể nói đến khối bit 3D trong thành phần, khối ảnh-thành phần, khối mã 3D, vùng quan tâm, hoặc các đối tượng khác.

3.2

Khối mã 3D (3D code-block)

Nhóm ba chiều dạng khối chữ nhật của các hệ số từ cùng một băng con của khối ảnh-thành phần.

3.3

Quét khối mã 3D (3D code-block scan)

Thứ tự các hệ số khối mã 3D được truy cập trong quá trình mã hóa. Khối mã 3D được xử lý theo sọc, mỗi sọc gồm bn hàng (hoặc tất cả các hàng còn lại nếu ít hơn bốn hàng) và trải theo chiều rộng của khối mã 3D. Mỗi sọc được xử lý theo từng cột tính từ cột cao nhất tới thấp nhất và từ trái sang phải. Do vậy, toàn bộ khối mã 3D được quét theo từng lát ảnh. Trong mỗi lát ảnh lại tuân thủ theo ISO/IEC 15444-1.

3.4

Thành phần (component)

Dữ liệu nén từ dòng mã có dạng một tập đơn gồm dữ liệu hai hoặc ba chiều.

3.5

Thiết bị đọc phù hợp (conforming reader)

ng dụng dùng đ đọc và biên dịch tập tin JP3D một cách chính xác.

3.6

Mức phân tách (decomposition level)

Tập hợp các băng con nơi mà mỗi hệ số đều có cùng tác động theo không gian hoặc trải theo các mẫu gốc. Các băng con này gồm băng con [H|L|X][H|L|X][H|L|X] (ví dụ, LLL, LXL, XXH, …, trừ XXX) đưc chia theo các mức con phân tách ba chiều.

3.7

Băng con [H|L|X][H|L|X][H|L|X]   [H|L|X][H|L|X][H|L|X] (sub-band    [H|L|X][H|L|X][H|L|X]   [H|L|X][H|L|X][H|L|X])

H nghĩa là lọc thông cao, L nghĩa là lọc thông thấp, X nghĩa là không lọc. Bộ lọc đầu tiên là lọc theo chiều ngang, bộ lọc thứ hai là lọc theo chiều dọc và bộ lọc thứ ba là lọc theo trục (tức là, tương ứng theo các trục X, Y và Z). Việc lập thứ tự lọc cho băng con này phải luôn được lưu ý. Việc phục dựng sẽ thực hiện theo thứ tự lọc đảo ngược.

CHÚ THÍCH: Ở đây không bao gồm băng con XXX (như định nghĩa trong 3.6).

3.8

Ảnh (image)

Tập tất cả các thành phần hai hoặc ba chiều.

3.9

Độ lệch vùng ảnh (image area offset)

Số lượng điểm lưới tọa độ tham chiếu nằm dưới,  bên phải (và  một vị trí dọc trục trên) của gốc lưới tọa độ tham chiếu.

3.10

Thành phần trung gian (intermediate component)

Mảng dữ liệu đơn hai hoặc ba chiều tham gia vào giai đoạn biến đổi đa thành phần.

3.11

Thứ tự quét mành (raster order)

Thứ tự riêng theo dãy của dữ liệu có dạng bất k trong mảng. Thứ tự quét mành bắt đầu tại điểm dữ liệu cao nhất bên trái của lát ảnh đầu tiên và chuyển đến đim dữ liệu ngay bên phải, và tiếp tục như vậy đến cuối hàng. Sau khi đã đến cuối hàng, điểm dữ liệu tiếp theo trong dãy là điểm dữ liệu gần nhất bên trái ngay dưới hàng hiện tại. Thứ tự này cứ tiếp tục như vậy đến cuối của lát ảnh. Sau đó, lát ảnh tiếp theo sẽ được xử lý theo dạng mảng ba chiều. Thứ tự như vậy được tiếp tục đến cuối mảng.

3.12

Phân giải (resolution)

Mối quan hệ không gian của các mẫu theo không gian vật lý. Trong tiêu chuẩn này, các mức phân tách của biến đổi sóng con sẽ tạo nên các phân giải chênh lệch theo lũy thừa hai ở chiều ngang, chiều dọc, hoặc trong trường hợp ba chiều là hướng trục, hoặc mọi sự kết hợp có thể của các hướng. Mức phân tách cuối cùng (cao nhất) gồm một băng con [L|X][L|X][L|X] (lưu ý là không bao gồm XXX), được coi là phân giải thấp hơn. Do vậy, sẽ có hơn một mức phân giải so với số mức phân tách.

3.13

Mức phân giải (resolution level)

Tương đương với mức phân tách, ngoại trừ rằng băng con [L|X][L|X][L|X] cũng là một mức phân giải riêng.

3.14

Mẫu (sample)

Một phần tử trong mảng hai hoặc ba chiều có cha một thành phần.

3.15

Lát ảnh (slice)

Lát ảnh là một tập hợp con ảnh điểm hai chiều của một thực thể lập thể, khối mã lập thể hoc ảnh lập thể. Lát ảnh có vị trí trực giao với trục hoặc trục z.

3.16

Hệ tọa độ không gian (spatial coordinates)

Hệ tọa độ không gian được biểu thị bi các trục x, y và z. Nói chung, thuật ngữ trục sẽ đưc sử dụng để ch chiều Z.

3.17

Băng con (sub-band)

Nhóm các hệ số biến đổi sinh ra từ cùng một chuỗi các quá trình lọc thông thấp và thông cao.

3.18

Bc băng con (sub-band order)

Trong cùng mức phân giải, các băng con được xử lý và được báo hiệu như xác định trong ISO/IEC 15444-1 và ISO/IEC 15444-2 đối với lọc hai chiều, tuân theo thứ tự quét Morton [1]. Đặc tả được m rộng cho trường hợp ba chiều trong trường hợp triển khai thứ tự quét Morton ba chiều.

3.19

Khối ảnh (tile)

Mảng hình khối của các đim nằm trên lưới tọa độ tham chiếu, được biểu thị bằng một độ lệch so với gốc lưới tọa độ tham chiếu và được định nghĩa bi chiều rộng (chiều x), chiều cao (chiều y) và chiều sâu (chiều z). Các khối nh xếp chồng được gọi là các khối ảnh-thành phần.

4  Thuật ngữ viết tắt

Tiêu chuẩn này sử dụng các thuật ngữ viết tắt nêu trong Điều 4 của ISO/IEC 15444-1 và Điều 4 của ISO/IEC 15444-2.

5  Ký hiệu (và thuật ngữ viết tắt)

Tiêu chuẩn này sử dụng các ký hiệu nêu trong Điều 4 của ISO/IEC 15444-1 và Điều 5 của ISO/IEC 15444-2.

6  Mô tả chung

Tiêu chuẩn này đưa ra các phương pháp nén không tổn thất (bảo toàn các bit) và nén có tổn thất để mã hóa các ảnh màu số lập thể có sắc độ liên tục, hai mức, theo thang màu xám hoặc các ảnh lập thể đa thành phần. Các phương pháp này (xem Phụ lục A) m rộng các phần tử trong hệ thống mã hóa lõi được mô tả trong ISO/IEC 15444-1 và ISO/IEC 15444-2. Các mở rộng liên quan đến việc mã hóa và giải mã được xác định là các thủ tục có thể được sử dụng kết hợp với các quá trình mã hóa và giải mã được mô tả trong ISO/IEC 15444-1 và ISO/IEC 15444-2. Mỗi m rộng mã hóa và giải mã sẽ chỉ được sử dụng kết hợp với các quá trình mã hóa nhất định và chỉ tuân th các yêu cầu được đưa ra  đây. Tiêu chuẩn này cũng đưa ra các mở rộng về định dạng dữ liệu nén, tức là định dạng trao đi và các định dạng rút gọn.

Cụ thể là, tiêu chun này hỗ trợ các m rộng sau đối với ISO/IEC 15444-2:

1) độ lệch DC biến thiên;

2) các nhân biến đổi sóng con tùy ý;

3) các biến đi đa thành phần;

4) các biến đổi phi tuyến;

5) vùng quan tâm.

 

Phụ lục A

(Quy định)

Cú pháp dòng mã, phần mở rộng

A.1  Khả năng mở rộng

Cú pháp trong phụ lục này hỗ trợ các mở rộng trong tiêu chuẩn này. Các đoạn nhãn tuân thủ các quy tác về cú pháp trong Phụ lục A của ISO/IEC 15444-1. Phần bổ sung của các giá trị tham số đối với một số đoạn nhãn trong ISO/IEC 15444-1 và ISO/IEC 15444-2, và phần bổ sung của các đoạn nhãn mới sẽ đưa ra thông tin cụ thể cho các m rộng trong tiêu chuẩn này.

Trong mọi đoạn nhãn, hai byte đầu tiên ngay sau nhãn phải là một giá trị không báo hiệu biểu thị chiều dài của các tham số đoạn nhãn theo byte (bao gồm c hai byte tham s chiều dài nhưng không gồm hai byte nhãn).

Nếu một đoạn nhãn hiện chưa được chỉ rõ trong tiêu chuẩn này hoặc trong ISO/IEC 15444-1 và ISO/IEC 15444-2 lại xuất hiện trong một dòng mã thì bộ giải mã phải sử dụng tham số chiều dài để loại bỏ đoạn nhãn này. Bảng A.1 đưa ra cách thức sử dụng đoạn nhãn trong tiêu chuẩn này.

Bảng A.1 – Danh sách nhãn và đoạn nhãn

 

 hiệu

Tiêu đề chính

Tiêu đề khối nh-bộ phận

ISO/IEC 15444-x cũ/ m rộng

Phân định các nhãn và đoạn nhãn

 

 

 

 

 

Bắt đầu dòng mã

SOC

0xFF4F

yêu cầu

không cho phép

ISO/IEC 15444-1:2004

Bắt đầu khối ảnh-bộ phận

SOT

0XFF90

không cho phép

yêu cầu

ISO/IEC 15444-2:2004

Bắt đầu dữ liệu

SOD

0xFF93

không cho phép

nhãn cuối cùng

ISO/IEC 15444-1:2004

Kết thúc dòng mã

EOC

0xFFD9

không cho phép

không cho phép

ISO/IEC 15444-1:2004

Các đoạn nhãn thông tin cố định

 

 

 

 

 

Kích thước ảnh và khối ảnh

SIZ

0xFF51

yêu cầu

không cho phép

ISO/IEC 15444-1:2004

Kích thước ảnh và khối ảnh chiều bổ sung

NSI

0xFF54

yêu cầu

không cho phép

 

Các khả năng m rộng

CAP

0xFF50

yêu cầu

không cho phép

ISO/IEC 15444-2:2004/ Bổ sung.2:2006

Các đoạn nhãn chức năng

 

 

 

 

Mặc đnh kiểu mã hóa

COD

0xFF52

yêu cầu

tùy chọn

ISO/IEC 15444-1:2004, m rộng

Thành phần kiu mã hóa

COC

0xFF53

tùy chọn

tùy chọn

ISO/IEC 15444-1:2004, mở rộng

Vùng quan tâm

RGN

0xFF5E

tùy chọn

tùy chọn

ISO/IEC 15444-2:2004, mở rộng

Mặc định lượng tử hóa

QCD

0xFF5C

yêu cầu

tùy chọn

ISO/IEC 15444-1:2004, m rộng

Thành phần lượng tử hóa

QCC

0xFF5D

tùy chọn

tùy chọn

ISO/IEC 15444-1:2004, m rộng

Các nhân biến đổi tùy ý

ATK

0xFF79

tùy chọn

tùy chọn

ISO/IEC 15444-2:2004

Định nghĩa chiều sâu bit thành phần

CBD

0xFF78

tùy chọn

tùy chọn

ISO/IEC 15444-2:2004

Định nghĩa biến đổi đa thành phần

MCT

0xFF74

tùy chọn

tùy chọn

ISO/IEC 15444-2:2004

Tập hợp biến đổi đa thành phần

MCC

0xFF75

tùy chọn

tùy chọn

ISO/IEC 15444-2:2004

Thứ tự biến đi đa thành phần

MCO

0xFF77

tùy chọn

tùy chọn

ISO/IEC 15444-2:2004

Biến đổi điểm phi tuyến

NLT

0xFF76

tùy chọn

tùy chọn

ISO/IEC 15444-2:2004

Độ lệch DC biến thiên

DCO

0xFF70

tùy chọn

tùy chọn

ISO/IEC 15444-2:2004

Các đoạn nhãn con tr

 

 

 

 

 

Các chiều dài khối nh-bộ phận

TLM

0xFF55

tùy chọn

không cho phép

ISO/IEC 15444-1:2004

Chiều dài gói tin, tiêu đề chính

PLM

0xFF57

tùy chọn

không cho phép

ISO/IEC 15444-1:2004

Chiều dài gói tin, tiêu đề khối ảnh-bộ phận

PLT

0xFF58

không cho phép

tùy chọn

ISO/IEC 15444-1:2004

Các tiêu đề gói tin đóng gói, tiêu đề chính

PPM

0xFF60

tùy chọn

không cho phép

ISO/IEC 15444-1:2004

Các tiêu đề gói tin đóng gói, tiêu đề khối ảnh-bộ phận

PPT

0xFF61

không cho phép

tùy chọn

ISO/IEC 15444-1:2004

Các nhãn và đoạn nhãn trong dòng bit

 

 

 

 

 

Bắt đầu gói tin

SOP

0xFF91

không cho phép

Không cho phép trong tiêu đề khối ảnh-bộ phận, tùy chọn trong dòng bit

ISO/IEC 15444-1:2004

Kết thúc tiêu đề gói tin

EPH

0xFF92

Tùy chọn trong đoạn nhãn PPM

Tùy chọn trong đoạn nhãn PPT hoặc trong dòng bit

ISO/IEC 15444-1:2004

Các đoạn nhãn cung cấp thêm thông tin

 

 

 

 

 

Đăng ký thành phần

CRG

0xFF63

tùy chọn

không cho phép

ISO/IEC 15444-1:2004, m rộng

Chú giải

COM

0xFF64

tùy chọn

tùy chọn

ISO/IEC 15444-1:2004

a) “Yêu cầu” nghĩa là nhãn hoặc đoạn nhãn phải nằm trong tiêu đề này, “tùy chọn” nghĩa là có thể được sử dụng.

A.2  Các mở rộng đối với các tham số đoạn nhãn trong ISO/IEC 15444-1 và ISO/IEC 15444-2

A.2.1  Kích thước ảnh và khối ảnh chiều bổ sung (NSI)

Chức năng: Cung cấp thông tin về ảnh chưa nén, ví dụ chiều sâu của lưới tọa độ tham chiếu, chiều sâu của các khối nh, và sự phân chia các mẫu thành phần theo lưới tọa độ tham chiếu.
Cách sử dụng: Tiêu đề chính. Phải có một và ch một NSI trong tiêu đề chính.
Chiều dài: Biến thiên tùy theo số lượng thành phần.

Hình A.1 – Cú pháp kích thước ảnh và khối ảnh chiều bổ sung (mở rộng)

NSI:

Mã nhãn. Bảng A.2 đưa ra các giá trị kích thước và tham số của ký hiệu và các tham số đối với đoạn nhãn kích thước ảnh và khối ảnh chiều bổ sung.

Lnsi:

Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bằng công thức sau:

Lnsi = 19 + Csiz            (A-1)

Ndim:

Xác định tính chất chiều của tập dữ liệu (không xét đến chiều của thành phần). Giá trị này được đặt mặc định là 3.

Zsiz:

Chiều sâu của lưới tọa độ tham chiếu.

ZOsiz:

Độ lệch chiều sâu từ gốc lưới tọa độ tham chiếu đến góc trước bên trái phía trên của khối ảnh.

ZTsiz:

Chiều sâu của khối ảnh tham chiếu so với lưới tọa độ tham chiếu.

ZTOsiz:

Độ lệch dọc từ gốc lưới tọa độ tham chiếu đến góc trước bên trái phía trên của khối ảnh đầu tiên.

ZRsizi:

Phân chia chiều sâu của một mẫu của thành phần thứ i so với lưới tọa độ tham chiếu. Tham số này xuất hiện một lần đối với mỗi thành phần, và chúng xuất hiện theo thứ tự thành phần.

Bng A.2 – Các giá tr tham số kích thước ảnh và khối ảnh chiều bổ sung (mở rộng)

Tham số

Kích thước (bit)

Giá tr

NSI

16

0xFF54

Lnsi

16

20-16403

Ndim

8

3

Zsiz

32

1 -(232 – 1)

ZOsiz

32

0-(232 – 1)

ZTsiz

32

1-(232 – 1)

ZTOsiz

32

1-(232  2)

ZRsizi

8

1-255

A.2.2  Mặc định kiều mã hóa (COD), m rộng của ISO/IEC 15444-1

Chức năng: Mô tả kiểu mã hóa, số lượng mức phân tách và việc phân lớp mặc định được sử dụng để nén mọi thành phần của ảnh (nếu nằm trong tiêu đề chính) hoặc khối ảnh (nếu nằm trong tiêu đề khối ảnh-bộ phận). Đối vi mỗi thành phần riêng lẻ, các giá trị tham số này có thể bị ghi đè bởi một đoạn nhãn COC trong tiêu đề chính hoặc tiêu đề khối ảnh-bộ phận.
Cách sử dụng: Tiêu đề chính và tiêu đề khối ảnh-bộ phận đầu tiên của mỗi khối ảnh nhất định. Chỉ có một và chỉ một COD trong tiêu đề chính. Hơn nữa, mỗi khối ảnh có thể chỉ có tối đa một COD. Nếu khối ảnh có nhiều khối ảnh-bộ phận, và có đoạn nhãn này thì COD chỉ có thể có trong khối nh-bộ phận đầu tiên (TPsot = 0).

Khi được sử dụng trong tiêu đề chính, các giá trị tham số đoạn nhãn COD được sử dụng cho mọi khối nh-thành phần không có đoạn nhãn COC tương ứng trong tiêu đề chính hoặc tiêu đề khối ảnh-bộ phận. Khi được sử dụng trong tiêu đề khối ảnh-bộ phận, giá trị tham số này ghi đè lên COD và các COC của tiêu đề chính và đưc sử dụng cho mọi thành phần trong khối ảnh đó mà không cần một đoạn nhãn COC tương ứng trong khối ảnh-bộ phận. Do vậy, thứ tự ưu tiên như sau:

COC khối ảnh-bộ phận > COD khối ảnh-bộ phận > COC chính > COD chính

với ký hiệu “lớn hơn”, >, có nghĩa là đoạn nhãn lớn hơn ghi đè lên nhãn bé hơn.

Chiều dài: Biến thiên tùy theo giá tr của Scod (xem tham số Lcod).

Hình A.2 – Cú pháp mặc định kiu mã hóa

COD: Mã nhãn. Bảng A.3 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn mặc định kiểu mã hóa.
Lcod: Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). Giá tr của tham số này được xác định bằng công thức sau:
maximum_precincts

(A-2)

user_defined_precints
với maximum_precincts và user_defined_precincts được cho trong tham số Scod và number_of_resolution_levels được tính toán bằng cách sử dụng số lượng tham số mức phân tách đối với từng chiều trong ba chiều, X, Y và Z, như được cho trong tham số SPcod. Công thức thực tế để tính toán số lượng mức phân giải được cho trong B.5.
Scod: Kiểu mã hóa đối với mọi thành phần. Bng A.4 đưa ra giá trị đối với tham số Scod.
SGcod: Các tham số đối với kiểu mã hóa được ch định trong Scod. Các tham số là độc lập với các thành phần và được định rõ theo thứ tự từ cao xuống thp như trong Bảng A.5. Các tham số kiểu mã hóa thuộc trường SGcod xuất hiện theo dãy như trong Hình A.3.
SPcod: Các tham số đối với kiểu mã hóa được chỉ rõ trong Scod. Các tham số này liên quan đến mọi thành phần và được ch định theo thứ tự từ cao xuống thấp như trong Bảng A.6. Các tham số kiểu mã hóa trong trường SPcod xuất hiện theo dãy như trong Hình A.3.

Bảng A.3 – Các giá trị tham số mặc định kiểu mã hóa, phần m rộng

Tham số

Kích thước (bit)

Giá trị

COD

16

0xFF52

Lcod

16

17-83

Scod

8

Bảng A.4

SGcod

32

Bảng A.5

SPcod

Biến thiên

Bảng A.6

 

A

Thứ tự lũy tiến

B

Số lớp

C

Biến đổi đa thành phần

D

Số mức phân tách dọc trục X

E

Số mức phân tách dọc trục Y

F

Số mức phân tách dọc trục Z

G

Chiều rộng khối mã

H

Chiều cao khối mã

I

Chiều sâu khối mã

J

Kiểu khối mã

K

Nhân biến đổi dọc trục X

L

Nhân biến đổi dọc trục Y

M

Nhân biến đổi dọc trục Z

Ni – Nn

Các kích thước phân khu

Hình A.3 – Sơ đồ tham số kiểu mã hóa của các tham số SGcod và SPcod

Bảng A.4 – Các giá trị tham số kiểu mã hóa đối với tham số Scod

Giá trị (bit) MSB LSB

Kiu mã hóa

xxxx xxx0

Bộ mã hóa và giải mã entropy, các phân khu có PPx = 15, PPy = 15 and PPz = 15

xxxx xxx1

Bộ mã hóa và giải mã entropy với các phân khu thông lệ như định nghĩa ở dưới

xxxx xx0x

Không có đoạn nhãn SOP nào được sử dụng

xxxx xx1x

Các đoạn nhãn SOP có thể được sử dụng

xxxx x0xx

Không có nhãn EPH nào được sử dụng

xxxx x1xx

Nhãn EPH có thể được sử dụng

 

Tất cả các giá trị khác dùng cho dự phòng

Bảng A.5 – Các giá trị tham số kiểu mã hóa đối với tham số Gcod

Tham số (theo thứ tự)

Kích thước (bit)

Giá trị

Ý nghĩa của các giá trị SGcod

Thứ tự lũy tiến

8

Bảng A.16 của ISO/IEC 15444-1

Thứ tự lũy tiến

Số lượng lớp

16

1-65535

Số lượng các lớp

Biến đổi đa thành phần

8

Bảng A.8 của ISO/IEC 15444-2

Cách sử dụng biến đổi đa thành phần

Bảng A.6 – Các giá trị tham số kiu mã hóa của các tham số SPcod và SPcoc, phần m rộng

Tham số (theo th tự)

Kích thước (bit)

Giá trị

Ý nghĩa của các giá trị SPcod

Số lượng mức phân tách dọc trục X

8

0-32

Số lượng mức phân tách dọc trục X, NLX, 0 nghĩa là không có biến đổi

Số lượng mức phân tách dọc trục Y

8

0-32

Số lượng mức phân tách dọc trục Y, NLY, 0 nghĩa là không có biến đổi

Số lượng mức phân tách dọc trục z

8

0-32

Số lượng mức phân tách dọc trục Z, NLZ, 0 nghĩa là không có biến đổi

Chiều rộng khối mã 3D

8

Bảng A.7

Giá trị độ lệch theo hàm mũ của chiều rộng khối mã, xcb

Chiều dài khối mã 3D

8

Bảng A.7

Giá trị độ lệch theo hàm mũ của chiều dài khối mã, ycb

Chiều sâu khối mã 3D

8

Bảng A.7

Giá trị độ lệch theo hàm mũ của chiều sâu khối mã, zcb

Kiểu của khối mã 3D

8

Bảng A.8

Kiểu của các quá trình mã hóa của khối mã 3D

Nhân biến đi dọc trục X

8

Bảng A.10 của ISO/IEC 15444-2

Biến đi sóng con được sử dụng dọc trục X

Nhân biến đổi dọc trục Y

8

Bảng A.10 của ISO/IEC 15444-2

Biến đổi sóng con được sử dụng dọc trục Y
Nhân biến đổi dọc trục Z

8

Bảng A.10 của ISO/IEC 15444-2

Biến đổi sóng con được sử dụng dọc trục Z

Kích thước phân khu

Biến thiên

Bảng A.9

Nếu Scod hoặc Scoc = xxxx xxx0 thì không có tham số này; ngược lại thì tham số này chỉ ra chiều rộng, chiều dài và chiều sâu phân khu. Tham số đầu tiên (16 bit) tương ứng với băng con NLLLL. Mỗi tham số liên tiếp tương ứng với mỗi mức phân giải liên tiếp theo thứ tự.

Bảng A.7 – Số mũ chiều rộng, chiều cao hoặc chiều sâu của các khối mã 3D đối với các tham số SPcod và SPcoc

Giá trị (bit)
MSB LSB

Chiều rộng, chiều cao và chiều sâu của khối mã 3D

xxxx 0000 – xxxx 1011

Các giá trị số mũ chiều rộng, chiều cao và chiều sâu của khối mã 3D xcb = giá trị, ycb = giá tr hoặc zcb = giá trị.

CHÚ THÍCH: Phần này định nghĩa lại ISO/IEC 15444-1. Chiều rộng, chiều cao và chiều sâu của khối mã 3D bị giới hạn ở các lũy thừa của 2 với kích thước nhỏ nhất là 20 và lớn nhất là 210.

Hơn nữa, kích thước khối mã 3D bị giới hạn sao cho 4 ≤ xcb+ycb+zcb ≤ 18.

 

Tt cả các giá trị khác dùng cho dự phòng

Bảng A.8 – Kiểu khối mã 3D đối với các tham số SPcod và SPcoc, mở rộng

Giá trị (bit)
MSB LSB

Kiểu khối mã 3D

xxxx xxx0

Không lựa chọn bỏ qua mã hóa số học

xxxx xxx1

Lựa chọn bỏ qua mã hóa số học

xxxx xx0x

Không đặt lại các xác suất ngữ cảnh trên các biên thẻ mã hóa

xxxx xx1x

Đặt lại các xác suất ngữ cảnh trên các biên quá trình mã hóa

xxxx x0xx

Không kết thúc trên mỗquá trình mã hóa

xxxx x1xx

Kết thúc trên mỗi quá trình mã hóa

xxxx 0xxx

Không có ngữ cảnh nhân quả

xxxx 1xxx

Các ngữ cnh nhân quả

xxx0 xxxx

Không kết thúc đoán trước

xxx1 xxxx

Kết thúc đoán trước

xx0x xxxx

Không có ký hiệu phân đoạn nào được sử dụng

xx1x xxxx

Các ký hiệu phân đoạn được sử dụng
  Tất cả các giá trị khác dùng cho dự phòng

Bảng A.9 – Chiều rộng, chiều dài và chiều sâu phân khu đối với các tham số SPcod và Spcoc, phần mở rộng

Giá trị (bit)
MSB LSB

Kích thước phân khu

xxxx xxxx xxxx 0000 –
xxxx xxxx xxxx 1111

4 LSB là số mũ chiều rộng phân khu PPx = giá trị. Giá trị này có thể chỉ bằng 0 tại mức phân giải tương ứng với băng NLLLL

xxxx xxxx 0000 xxxx –
xxxx xxxx 1111 xxxx

4 bit tiếp theo là số mũ chiều dài phân khu PPy = giá trị. Giá trị này có thể chỉ bằng 0 tại mức phân giải tương ứng với băng NLLLL

xxxx 0000 xxxx xxxx –
xxxx 1111 xxxx xxxx

4 bit tiếp theo là s mũ chiều sâu phân khu PPz = value. Giá trị này có thể chỉ bằng 0 tại mức phân giải tương ứng với băng NLLLL.
  Tất cả các giá trị khác dùng chdự phòng.

A.2.3  Thành phần kiểu mã hóa (COC), m rộng của ISO/IEC 15444-1

Chức năng: Mô tả kiểu mã hóa và số lượng mức phân tách được sử dụng để nén một thành phần nhất định.
Cách sử dụng: Tiêu đề chính và tiêu đề khối ảnh bộ phận đầu tiên của một khối ảnh nào đó. Cách sử dụng là tùy chọn ở cả các tiêu đề chính và khối ảnh-bộ phận. Trong cả các tiêu đề chính hoặc khối ảnh-bộ phận, mỗi thành phần nhất định chỉ có thể có tối đa một COC. Nếu có nhiều khối ảnh-bộ phận trong một khối ảnh và có đoạn nhãn này thì COC chỉ có thể có trong khối ảnh-bộ phận đầu tiên (TPsot = 0).

Đối vi mỗi thành phần, khi được sử dụng trong tiêu đề chính thì COC ghi đè lên đoạn nhãn COD chính. Đối với mỗi thành phần, khi được sử dụng trong tiêu đề khối ảnh-bộ phận thì COC ghi đè lên COD tiêu đề chính, COC chính và COD khối ảnh. Do đó, thứ tự ưu tiên như sau:

COC khối ảnh-bộ phận > COD khối ảnh-bộ phận > COC chính > COD chính

Với dấu “lớn hơn”, >, có nghĩa là đoạn nhãn lớn hơn ghi đè lên đoạn nhãn bé hơn.

Chiều dài: Biến thiên tùy theo giá trị của Scoc (xem tham số Lcoc).

Hình A.4 – Cú pháp thành phần kiểu mã hóa

 

COC: Mã nhãn. Bảng A.10 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn thành phần kiều mã hóa.
Lcoc: Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). Giá trị của tham số này được xác đnh bằng công thức sau:
maximum_precincts AND Csiz < 257

(A-3)

maximum_precincts AND Csiz ≥ 257
user_defined_precincts AND Csiz < 257
user_defined_precincts AND Csiz ≥ 257
Ccoc: Chỉ số của thành phần mà đoạn nhãn này liên quan. Các thành phần có chỉ số 0, 1, 2,  …
Scoc: Kiu mã hóa đối với thành phần này. Bảng A.11 đưa ra các giá trị đối với mỗi tham số Scoc.
SPcoc: Các tham số đối với kiểu mã hóa được xác định trong Scoc. Các tham số kiểu mã hóa trong trường SPcoc xuất hiện theo dãy thứ tự như trong Hình A.5.

 

A

B

C

D

E

F

G

H

I

J

Ki

Kn

A

Số lượng mức phân tách dọc trục X

B

Số lượng mức phân tách dọc trục Y

C

Số lượng mức phân tách dọc trục Z

D

Chiều rộng khối mã

E

Chiều cao khối mã

F

Chiều sâu khối mã

G

Kiểu khối mã

H

Nhân biến đổi dọc trục X

I

Nhân biến đổi dọc trục Y

J

Nhân biến đổi dọc trục Z

Ki – Kn

Các kích thước phân khu

Hình A.5 – Sơ đồ tham số kiểu mã hóa của tham số SPcoc

Bảng A.10 – Các giá trị tham s thành phần kiểu mã hóa, phần mở rộng

Tham số

Kích thước (bit)

Giá trị

COC

16

0xFF53

Lcoc

16

4-102

Ccoc

8

16

0-255; nếu Csiz < 257

0-16383; nếu Csiz ≥ 257

Scoc

8

Bảng A.11

SPcoci

Biến thiên

Bảng A.6

Bảng A.11 – Các giá tr tham số kiểu mã hóa đối với tham số Scoc, phần mở rộng

Giá tr (bit)
MSB LSB

Kiu mã hóa

xxxx xxx0

Bộ mã hóa và giải mã Entropy với các giá trị phân khu lớn nhất PPx = PP= PPz =15

xxxx xxx1

Bộ mã hóa và giải mã Entropy có các giá trị phân khu được xác định tronSPcoc
  Tất cả các giá trị khác dùng cho dự phòng

A.2.4  Vùng quan tâm (RGN), m rộng của ISO/IEC 15444-2

Chức năng: Báo hiệu về sự có mặt của vùng quan tâm (ROI) trong dòng mã.
Cách sử dụng: Tiêu đề chính và tiêu đề khối ảnh-bộ phận đầu tiên của khối ảnh cụ thể. Nếu có đoạn nhãn RGN trong tiêu đề chính với Srgn = 0 thì không được có bất kỳ một đoạn nhãn RGN nào trong dòng mã với giá trị Srgn khác 0 đối với thành phần được cho bi giá trị Crgn tương ứng. Ngược lại, nếu có đoạn nhãn RGN trong tiêu đề chính với giá trị Srgn khác 0 thì không được có bất kỳ một đoạn nhãn RGN nào trong dòng mã với Srgn = 0 đối với thành phần được cho bởi giá trị Crgn tương ứng.

Đối với mỗi khối ảnh, khi được sử dụng trong cả tiêu đề chính và tiêu đề khối ảnh-bộ phận đầu tiên thì RGN trong tiêu đề khối ảnh-bộ phận đầu tiên ghi đè lên RGN chính. Và, RGN xác định một thành phần đơn (Crgn ≠ 65 535) cũng ghi đè lên RGN xác định mọi thành phần (Crgn = 65 535). Do đó, thứ tự ưu tiên như sau:

RGN khối ảnh-bộ phận (Crgn ≠ 65 535) > RGN khối ảnh-bộ phận (Crgn = 65 535) > RGN chính (Crgn ≠ 65 535) > RGN chính (Crgn = 65 535)

Với dấu “ln hơn”, >, có nghĩa là đoạn nhãn lớn hơn ghi đè lên đoạn nhãn bé hơn.

Chiều dài: Biến thiên

Hình A.6 – Cú pháp vùng quan tâm

RGN: Mã nhãn. Bảng A.12 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn vùng quan tâm.
Lrgn: Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn).
Crgn: Chỉ số của thành phần mà nhãn này liên quan. Các thành phần có ch số 0, 1, 2,
Srgn: Kiểu ROI đối với ROI hiện tại. Bảng A.16 của ISO/IEC 15444-2 đưa ra giá trị đốvới tham số Srgn.
SPrgn: Tham số đối vi kiểu ROI được chỉ định trong SrgnSPrgn chỉ được báo hiệu đối với Srgn = 1 hoặc Srgn = 2.

Bảng A.12 – Các giá trị tham số vùng quan tâm, phần m rộng

Tham số

Kích thước (bit)

Giá trị

RGN

16

0xFF5E

Lrgn

16

5-30

Crgn

16

Bảng A.17 của ISO/IEC 15444-2

Srgn

8

Bảng A.16 của ISO/IEC 15444-2

SPrgn

Biến thiên

Bảng A.13

Bảng A.13 – Các gíá trị vùng quan tâm từ tham số SPrgn (Srgn = 1 hoặc Srgn = 2), phần mở rộng

Tham số (theo thứ tự)

Kích thước (bit)

Giá trị

Ý nghĩa của giá trị SPrgn

Dịch nhị phân

8

0-255

Dịch nhị phân của c hệ s trong vùng quan tâm trên hình nền.
XArgn (bên trái)

32

0-(232 -1)

Điểm lưới tọa độ tham chiếu ngang từ gốc của điểm đầu tiên. (Trong trường hợp ellipse, Srgn = 2, giá trị này không được lớn hơn chiều rộng của ảnh.)
YArgn ( trên)

32

0-(232 -1)

Điểm lưới tọa độ tham chiếu dọc từ gốc của điểm đầu tiên. (Trong trường hợp ellipse, Srgn = 2, giá trị này không được lớn hơn chiều cao của ảnh.)
ZArgn (mặt trước)

32

0-(232 -1)

Điểm lưới tọa độ tham chiếu trục từ gốc của điểm đầu tiên. (Trong trường hợp ellipse, Srgn = 2, giá trị này không được lớn hơn chiều sâu của ảnh.)
XBrgn (bên phải)

32

0-(232 -1)

Điểm lưới tọa độ tham chiếu ngang từ gốc của điểm thứ hai.
YBrgn ( dưới)

32

0-(232 – 1)

Điểm lưới tọa độ tham chiếu dọc từ gốc của điểm thứ hai.
ZBrgn (mặt sau)

32

0-(232 -1)

Điểm lưới tọa độ tham chiếu trục từ gốc của điểm thứ hai.

A.2.5  Mặc đnh thành phần lượng tử hóa (QCD), mở rộng của ISO/IEC 15444-1

Chức năng: Mô tả mặc định lượng tử hóa được sử dụng để nén tất cả các thành phần chưa được xác định bi một đoạn nhãn QCC. Đối với mỗi thành phần riêng l, các giá trị tham số này có th bị ghi đè bởi một đoạn nhãn QCC trong tiêu đề chính hoặc tiêu đề khối ảnh-bộ phận.
Usage: Tiêu đề chính và tiêu đề khối ảnh-bộ phận đầu tiên của một khối ảnh cụ thể. Chỉ có một và chỉ một QCD trong tiêu đề chính. Có thể có tối đa một QCD đối với mọi tiêu đề khối ảnh-bộ phận của mỗi khối ảnh. Nếu khối ảnh có nhiều khối ảnh-bộ phận, và có đoạn nhãn này thì QCD chỉ nằm trong khối ảnh-bộ phận đầu tiên (TPsot = 0).

Đối với thành phần nhất định, khi được sử dụng trong tiêu đề khối ảnh-bộ phận thì QCD đó ghi đè lên QCD chính và QCC chính. Do đó, thứ tự ưu tiên như sau:

QCC khối ảnh-bộ phận > QCD khối ảnh-bộ phận > QCC chính > QCD chính

Với dấu “lớn hơn”, >, có nghĩa là đoạn nhãn lớn hơn ghi đè lên đoạn nhãn bé hơn.

Chiều dài: biến thiên tùy theo số lượng phần t được lượng tử hóa.

Hình A.7 – Kiểu mặc định lượng tử hóa

QCD: Mã nhãn. Bảng A.14 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn mặc định lượng tử hóa.
Lqcd: Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bằng công thức sau:
no_quantization

(A-4)

scalar_quantization_derived
scalar_quantization_expounded
  với number_of_sub-bands (phụ thuộc vào số lượng mức phân tách dọc trục X, Y và Z axis) được xác định trong các đoạn nhãn COD và COC, và no_quantizationscalar_quantization_derived, hoặc scalar_quantization_expounded được báo hiệu trong tham số Sqcd.

CHÚ THÍCH: Lqcd có thể được sử dụng để xác đnh xem trong đoạn nhãn có bao nhiêu kích thước bước lượng tử hóa. Tuy nhiên, không nht thiết là số kích thước bước lượng tử hóa phải tương đương với số băng con hiện có do các băng con có thể bị b bt mà không cần phải sửa đoạn nhãn này.

Sqcd: Kiểu lượng tử hóa đối với mọi thành phần
SPqcdi: Giá trị kích thước bước lượng t hóa đối với băng con thứ i theo một thứ tự xác định (xem Phụ lục B). Số lượng tham số bằng số lượng băng con trong khối ảnh- thành phần có số lượng mức phân tách lớn nhất, NL.

Bảng A-14 – Các giá trị tham số mặc định lượng tử hóa, phần mở rộng

Tham số

Kích thước (bit)

Giá trị

QCD

16

0xFF5C

Lqcd

16

4-441

Sqcd

8

Bng A.28 của ISO/IEC 15444-1

SPqcdi

Biến thiên

Bảng A.28 của ISO/IEC 15444-1

A.2.6  Thành phần lượng tử hóa (QCC), m rộng của ISO/IEC 15444-1

Chức năng: Mô tả sự lượng tử hóa được sử dụng để nén một thành phần nhất định.
Cách sử dụng: Tiêu đề chính và tiêu đề khối ảnh-bộ phận đầu tiên của một khối ảnh nhất định. Cách sử dụng là tùy chọn ở cả các tiêu đề chính và tiêu đề khối ảnh-bộ phận. Với mỗi thành phần nht định, không có hơn một QCC trong các tiêu đề chính và tiêu đề khối ảnh-bộ phận. Nếu một khối ảnh có nhiều khối nh-bộ phận, và có đoạn nhãn này thì QCC ch có th có trong khối ảnh-bộ phận đầu tiên (TPsot = 0).

Tùy chọn trong c các tiêu đề chính và tiêu đề khối ảnh-bộ phận. Đối với mỗi thành phần nhất định, khi được sử dụng trong tiêu đề chính thì QCC ghi đè lên đoạn nhãn QCD chính. Đối với mỗi thành phần nhất định, khi được sử dụng trong tiêu đề khối ảnh-bộ phận thì QCC ghi đè lên QCD chính, QCC chính, và QCD của khối ảnh. Do đó, thứ tự ưu tiên như sau:

QCC khối ảnh-bộ phận > QCD khối ảnh-bộ phận > QCC chính > QCD chính

Với dấu “ln hơn”, >, có nghĩa là đoạn lớn hơn ghi đè lên đoạn bé hơn.

Chiều dài biến thiên tùy theo số lượng phần tử được lượng tử.

Hình A.8 – Cú pháp của thành phần lượng tử hóa

 

 

QCD: Mã nhãn. Bản A.15 đưa ra kích thước và các giá trị của ký hiệu và các tham số đối với đoạn nhãn thành phần lượng tử hóa.
Lqcc: Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn). Giá trị của tham số này được xác định bằng công thức sau:
no_quantization AND Csiz < 257

(A-5)

scalar_quantization_derived AND Csiz < 257
scalar_quantization_expounded AND Csiz < 257
no_quantization AND Csiz ≥ 257
scalar_quantization_derived AND Csiz ≥ 257
scalar_quantization_expounded AND Csiz ≥ 257
  CHÚ THÍCH: Lqcc có th được sử dụng đ xác định xem có bao nhiêu kích thước bước lượng tử trong đoạn nhãn. Tuy nhiên, không nhất thiết là số lượng kích thước bước lượng t hóa phải tương đương với số lượng băng con hiện có do các băng con có thể bị b bt mà không cần phải sửa đoạn nhãn này.
Cqcc: Ch số của thành phần mà đoạn nhãn này liên quan. Các thành phần có ch số 0, 1, 2, … (8 hoặc 16 bit tùy theo kích thước Csiz.)
Sqcc: Kiểu lượng tử hóa đối với thành phần này.
SPqcci: Giá trị lượng tử hóa đối với mỗi băng con theo một thứ tự xác định (xem Phụ lục D). Số lượng tham số bằng số lượng băng con trong khối ảnh-thành phần có số lượng mức phân tách lớn nhất.

Bảng A.15 – Các giá trị tham s thành phần lượng tử hóa

Tham số

Kích thước (bit)

Giá trị

QCC

16

0xFF5D

Lqcc

16

5-443

Cqcc

8

0-255; nếu Csiz < 257

 

16

0-16383; nếu Csiz ≥ 257

Sqcc

8

Bảng A.28 của ISO/IEC 15444-1

SPqcci

Biến thiên

Bảng A.28 của ISO/IEC 15444-1

A.2.7  Đăng ký thành phần (CRG), m rộng của ISO/IEC 15444-1

Chức năng: Cho phép sự đăng ký riêng của các thành phần theo các thành phần khác. Với các mục đích mã hóa, các mẫu của các thành phần được coi là nằm tại các điểm lưới tọa độ tham chiếu là bội số nguyên của XRsiz, YRsiz và ZRsiz (xem Phụ lục B). Tuy nhiên, điều này có thể không phù hợp cho việc kết xuất ảnh. Đoạn nhãn CRG mô tả “trọng tâm” của các mẫu của từng thành phần theo sự phân chia. Đoạn nhãn này không có ảnh hưởng đến việc giải mã dòng mã.

CHÚ THÍCH: Độ lệch đăng ký thành phần này là theo độ lệch ảnh (XOsizYOsiz và ZOsiz) và sự phân chia thành phần (XRsiziYRsizi and ZRsizi). Ví dụ, điểm lưới tọa độ tham chiếu ngang đối vi các mẫu bên trái gần nhất của thành phần c là XRsizc.[XOsiz / XRsizc(Ngược lại đối với chiều dọc và chiều trục.) Độ lệch ngang được chỉ thị trong đoạn nhãn này là phần bổ sung vào độ lệch này.

Cách sử dụng: Chỉ trong tiêu đề chính. Chỉ một CRG có thể được sử dụng trong tiêu đề chính và điều này có thể áp dụng cho tất cả các khối nh.
Chiều dài: Biến thiên tùy theo số thành phần.

 

CRG

Lcrg

Xcrgi

Ycrgi

Zcrgi

 

Xcrgn

Ycrgn

Zcrgn

Hình A.9 – Cú pháp đăng ký thành phần

CRG: Mã nhãn. Bảng A.16 đưa ra kích thưc và các giá tr của ký hiệu và các tham số đối với đoạn nhãn đăng ký thành phần.
Lcrg: Chiều dài của đoạn nhãn theo byte (không bao gồm nhãn).
Xcrgi: Giá trị của độ lệch ngang, theo đơn vị là 1/65536 của phân chia ngang XRsizi, đối với thành phần thứ i. Do đó, di giá trị từ 0/65536 (mẫu tại điểm lưới tọa độ tham chiếu của mẫu) đến XRsizc (65535/65536) (ngay trước điểm lưới tọa độ tham chiếu của mẫu tiếp theo). Giá trị này được lặp lại đối vi mọi thành phn.
Ycrgi: Giá trị của độ lệch dọc, theo đơn vị là 1/65536 của sự phân chia dọc YRsizi đối với thành phần thứ i. Do đó, dải giá trị từ 0/65536 (mẫu tại điểm lưới tọa độ tham chiếu của mẫu) đến YRsizc (65535/65536) (ngay trước điểm lưới tọa độ tham chiếu của mẫu tiếp theo). Giá trị này được lặp lại đối với mọi thành phần.
Zcrgi: Giá trị của độ lệch trục, theo đơn vị là 1/65536 của sự phân chia trục ZRsizi, đối với thành phần thứ i. Do đó, dải giá trị từ 0/65536 (mẫu tại điểm lưới tọa độ tham chiếu của mẫu) đến ZRsizc (65535/65536) (ngay trước điểm lưới tọa độ tham chiếu của mẫu tiếp theo). Giá trị này được lặp lại đối với mọi thành phần.

Bảng A.16 – Các giá trị tham số đăng ký thành phần

Tham số

Kích thước (bit)

Giá trị

CRG

16

0xFF63

Lcrg

16

6-65534

Xcrgi

16

0-65535

Ycrgi

16

0-65535

Zcrgi

16

0-65535

A.2.8  Khả năng m rộng (CAP), ISO/IEC 15444-2:2004/Adm. 2:2006

Tiêu chuẩn này yêu cầu phải có đoạn nhãn CAP trong tiêu đề chính, với trường Pcap báo hiệu việc sử dụng ISO/IEC 15444-10 như được mô tả trong ISO/IEC 15444-2. Bảng A.17 giải thích cách sử dụng tham số Ccapi trong tiêu chuẩn này.

CHÚ THÍCH: Các khả năng m rộng này được phát triển sau phiên bản đầu tiên của ISO/IEC 15444-2, và được chi rõ trong bản sửa đổi của ISO/IEC 15444-2:2004/Amd.2:2006.

Tiêu chuẩn này yêu cầu trường Rsiz của đoạn nhãn SIZ (xem ISO/IEC 15444-2) phải báo hiệu sự có mặt của đoạn nhãn CAP bằng cách cho phép có bit có trọng số cao th hai. Điều này sẽ khiến các bộ giải mã không thể xử lý chính xác các dòng mã cho phép của ISO/IEC 15444-10 một cách liên tục. Do vậy, đoạn nhãn CAP nên xut hiện ngay sau đoạn nhãn SIZ, sao cho bộ giải mã có thể dễ dàng nhận ra các dòng mã cho phép của ISO/IEC 15444-10 trước khi gặp các đoạn nhãn mở rộng bất kỳ.

Bảng A.17 – Ccapi, phần m rộng

Giá trị (bit)
MSB LSB

Kiểu mã hóa

0000 0000 0000 0000 0000

Không có các khả năng mở rộng
  Tất cả các giá trị khác dùng cho dự phòng

 

Phụ lục B

(Quy định)

Ảnh và xếp thứ tự dữ liệu ảnh nén, phần mở rộng

B.1  Giới thiệu

Trong phụ lục này và các điều nhỏ của phụ lục, các biểu đồ và bảng chỉ có tính quy định trong trường hợp chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân th. Phụ lục này mô tả các thực thể cấu trúc khác nhau và tổ chức của chúng trong dòng mã: các thành phần, các khối ảnh, các băng con và các phần nhỏ của chúng.

Phụ lục này là phần mở rộng Phụ lục B cửa ISO/IEC 15444-1 thêm tính năng mã hóa khối, tức là, từ hai thành ba chiều không gian. Các phần sau đây sẽ ch mô tả những phần thay đổi so với Phụ lục B của ISO/IEC 15444-1 thêm chiều trục bổ sung. Trừ khi được ghi chú rõ thì mọi mô tả và các đặc tả của ISO/IEC 15444-1 vẫn được áp dụng.

B.2  Giới thiệu các khái niệm về cấu trúc dữ liệu ảnh

Đây là nội dung cập nhật B.1 của ISO/IEC 15444-1.

Các thành phần không còn chứa các mảng hai chiều của các mẫu, nhưng chúng lại gồm các mảng ba chiều của các mẫu. Mỗi thành phần, c, bây giờ có các tham số XRsizc, YRsizc và ZRsizc xác định sự ánh xạ giữa các mẫu thành phần và các điểm lưới tọa độ tham chiếu.

Mỗi mức phân giải đều gồm các băng con [L|H|X][L|H|X][L|H|X] (không bao gồm băng con LLL) hoặc băng con NLLLL, do đó làm thay đổi số lượng băng con trên mỗi mức phân tách,mvới m < NL, từ ba thành dải [2;7] (xem Hình D.6).

Mỗi băng con đều có gốc. Các điều kiện biên của băng con là riêng cho mỗi băng con [L|H|X][L|H|X][L|H|X].

B.3  Ánh xạ thành phần vào lưới tọa độ tham chiếu

Đây là nội dung cập nhật B.2 của ISO/IEC 15444-1.

Lưới tọa độ tham chiếu trở thành không gian ba chiều của các điểm có ch số từ (0, 0, 0) tới (Xsiz-1, Ysiz-1, Zsiz-1). Khi đó, mỗi “vùng ảnh” được xác định trên lưới tọa độ tham chiếu bằng các tham số chiu, (Xsiz, Ysiz, Zsiz) và (XOsiz, YOsiz, ZOsiz). Cụ thể là, vùng ảnh trên lưới tọa độ tham chiếu được xác định bởi các điểm lưới tọa độ tham chiếu của chúng tại vị trí (XOsiz, YOsiz, ZOsiz) và (Xsiz-1, Ysiz-1, Zsiz-1).

Các mẫu của thành phần c bây giờ nằm tại các vị trí bội số nguyên của (XRsizc, YRsizc, ZRsizc) trên lưới tọa độ tham chiếu. Mỗi vùng thành phần là một phiên bản mẫu con của lưới tọa độ tham chiếu có tọa độ (0, 0, 0) là đim chung của từng thành phần.

Do đó, các mẫu của thành phần c được ánh xạ vào một hình khối có các tọa độ góc (x0, y0, z0) và (X– 1, y-1, z1 -1), với x0, y0, x1 và y1 được xác định bi công thức B-1 của ISO/IEC 15444-1 và z0 và z1 xác định như sau:

                             (B-1)

Do đó, ba chiều của thành phần c được xác định bởi

(chiều rộng, chiều cao, chiều sâu) = (x1 – x0, y1 – y0z1 – z0)           (B-2)

Các tham số Zsiz, ZOsiz và ZRsizc đều được xác định trong đoạn nhãn NSI (xem A.2.1).

B.4  Phân chia vùng ảnh thành các khối ảnh và các khối ảnh-thành phần

Đây là nội dung cập nhật B.3 của ISO/IEC 15444-1.

Lưới tọa độ tham chiếu được phân chia thành một mảng ba chiều kích thước thông thường của các khối ảnh. Trên lưới tọa độ tham chiếu, kích thước khối ảnh và các độ lệch phân chia khối ảnh được xác định tương ứng bởi các cặp chiều (XTsiz, YTsiz, ZTsiz) và (XTOsiz, YTOsiz, ZTOsiz). ZTsiz và ZTOsiz là các tham số từ đoạn nhãn NSI.

Mọi khối ảnh đều có chiều rộng các điểm lưới tọa độ tham chiếu XTsiz, chiều cao các đim lưới tọa độ tham chiếu YTsiz và chiều sâu các đim lưới tọa độ tham chiếu ZTsiz. Góc trên bên trái mặt trước của khối ảnh đầu tiên (khối ảnh 0) có độ lệch so với góc trên bên trái mặt trước của lưới tọa độ tham chiếu là (XTOsiz, YTOsiz, ZTOsiz). Các khối ảnh được đánh số theo thứ tự quét mành (tức là, từ trái sang phải, cao xuống thấp, trước ra sau). Con số này là chỉ số khối ảnh.

Các độ lệch lưới khối ảnh (XTOsiz, YTOsiz, ZTOsiz) bị giới hạn không được ln hơn các độ lệch vùng ảnh. Điều này được thể hiện bằng công thức B-3 của ISO/IEC 15444-1 và được bổ sung bằng dải sau đây:

0 ≤ ZTOsiz  ZOsiz                                                      (B-3)

Kích thước khối ảnh cộng với độ lệch khối ảnh phải lớn hơn độ lệch vùng nh. Điều này đảm bảo rằng khối ảnh đầu tiên (khối ảnh 0) sẽ chứa ít nhất một điểm lưới tọa độ tham chiếu từ vùng ảnh. Điều này đã được th hiện bi công thức B-4 của ISO/IEC 15444-1 và được bổ sung bằng dải sau đây:

ZTsiz + ZTOsiz > ZOsiz                                                  (B-4)

Số lượng khối ảnh trên chiều ngang (X) (numXtiles) và chiều dọc (Y) (numYtiles) được cho bi công thức B-5 của ISO/IEC 15444-1. Số lượng khối ảnh trên chiều trục (Z) (numZtiles) được cho như sau:

                                              (B-5)

Để thuận tiện trong việc mô tả thì các khối ảnh cần được đánh số theo vị trí ngang, dọc và trục. Đặt px là chỉ số ngang của một khối ảnh và py là chỉ số dọc của khối ảnh, khi đó pz sẽ là chỉ số trục của khối ảnh, lấy từ 0 đến (numZtiles – 1). Công thức sau định nghĩa lại px and py (Công thức B-6 của T.800 I ISO/IEC 15444-1) và định nghĩa pz:

px = mod(mod(t,numXtiles · numYtiles),numXtiles)

                                            (B-6)

Đối với các tọa độ của một khối ảnh cụ thể trên lưới tọa độ tham chiếu, chúng được mô tả bằng các công thức sau:

tx0(px,py,pz= max(XTOsiz + px · XTsiz,XOsiz)

ty0(px,py,pz= max(YTOsiz + py · YTsiz,YOsiz)

tz0(px,py,pz= max(ZTOsiz + pz · ZTsiz,ZOsiz)

tx1(px,py,pz= min(XTOsiz + (px+1) · XTsiz,Xsiz)               (B-7)

ty1(px,py,pz= min(YTOsiz + (py+1) · YTsiz,Ysiz)

tz1(px,py,pz= min(ZTOsiz + (pz+1) · ZTsiz,Zsiz)

Với tx0(pxpypz), ty0(pxpypz) và tz0(pxpypz) là các tọa độ của góc trên bên trái mặt trước của khối ảnh và tx1(pxpypz)  1, ty1(pxpypz) – 1 và tz1(pxpypz)  1 là các tọa độ của góc dưới bên phải mặt sau của khối ảnh. Chúng ta thường bỏ qua các tọa độ của khối ảnh khi nói đến một khi ảnh cụ thể và thay vào đó lại nói đến các tọa độ (tx0, ty0, tz0) và (tx1, ty1tz1).

Do đó, các chiều của một khối ảnh trên lưới tọa độ tham chiếu là:

(tx1 – tx0ty1 – ty0tz1 – tz0)                                                          (B-8)

Trong miền của thành phần ảnh i, các tọa độ của mẫu trên bên trái mặt trước được cho bi (tcx0tcy0tcz0) và các tọa độ của mẫu dưới bên phải mặt sau dưới được cho bởi (tcx1tcy1, tcz1), với tcx0tcy0tcx1 và tcy1 đã được mô tả trong Công thức B-12 của ISO/IEC 15444-1 và tcz0 và tcz1 được cho bi công thức sau:

                                                     (B-9)

Do vậy, các chiều của khối ảnh-thành phần trong lưi tọa độ tham chiếu là:

(tcx1 – tcx0, tcy1 – tcy0, tcz1 – tcz0)                                               (B-10)

B.5  Phân chia khối ảnh-thành phần biến đi thành các mức phân gii và các băng con

Đây là nội dung cập nhật B.5 của ISO/IEC 15444-1.

CHÚ THÍCH: Mặc dù ISO/IEC 15444-10 (JP3D) cho phép từng chiều trong ba chiều có số lượng mức phân tách khác nhau (chiều ngang biểu thị bằng X, chiều dọc biểu th bằng Y và chiều trục bằng Z), điều này về cơ bản là khác với Phụ lục F của ISO/IEC 15444-2: “Sự phân tách tùy ý của các khối ảnh-thành phần”. Sự phân tách của một khối ảnh-thành phần được mô tả trong tiêu chuẩn này KHÔNG PHẢI là tùy ý.

Mỗi khối ảnh-thành phần được biến đổi sóng con với các mức phân tách NLX trong chiều ngang, các mức phân tách NLY trong chiều dọc và các mức NLZ trong chiều trục như được mô tả trong Phụ lục D. Chiều có số lượng mức phân tách lớn nhất cũng quyết định số lượng mức phân giải. Do đó, với NL = max(NLX, NLY, NLZ) như xác định trong D.3.2, thì sẽ có (NL + 1) mức phân giải riêng, biểu thị bằng r = 0, 1,…, NL. Mỗi mức phân giải, r, được thể hiện bằng băng n[L|X][L|X][L|X], có n = NL – r, với loại băng con thực tế được xác định bằng số lượng phân tách trong mỗi chiều (xem D.4.1). Ví dụ, khi NLX bằng 3, NLY bằng 3 và NLZ bằng 2, thì tại r = 0, mức phân giải thấp nhất được biểu th bằng băng 3LLX, còn tại = 1, mức phân giải được biểu thị bằng băng 2LLL. Phần này mô tả các chiều của sự phân giải giảm dần này.

Các tọa độ của một khối ảnh-thành phần nào đó có liên quan đến lưới tọa độ tham chiếu tại một mức phân giải cụ thr, sẽ sinh ra các tọa độ của mẫu trên bên trái mặt trước, (trx0try0trz0) và các tọa độ của mẫu dưới bên phải mặt sau, (trx­1try1 – 1, trz1 – 1), với:

     

                                (B-11)

    

Theo cách tương tự, các tọa độ khối ảnh có thể được ánh xạ vào băng con bất kỳ, b, sinh ra các tọa độ của mẫu trên bên trái mặt trước (tbx0tby0tbz0) và các tọa độ của mẫu dưới bên phải mặt sau (tbx 1, tby 1, tbz 1) với:

       

             (B-12)

       

với nxbnyb và nzb, được xác định trong Công thức B-13, th hiện các mức phân tách tương ứng đối với các hướng ngang (X), hưng dọc (Y) và hướng trục (Z) của băng con b. Các đại lượng (xobyobzob) được cho trong Bảng B.1.

nxb = min(NL – r + 1, NLX)

nyb = min(NL – r + 1, NLY)                                                   (B-13)

nzb = min(NL – r + 1, NLZ)

Bảng B.1 – Các đại lượng (xo­byobzob) đối với băng con b

Loại băng con

xob

yob

zob

[L|X][L|X][L|X]

0

0

0

H[L|X][L|X]

1

0

0

[L|X]H[L|X]

0

1

0

HH[L|X]

1

1

0

[L|X][L|X]H

0

0

1

H[L|X]H

1

0

1

[L|X]HH

0

1

1

HHH

1

1

1

Đối với mỗi băng con, các tọa độ này xác định các biên khối ảnh trong các miền băng con riêng biệt. Hơn nữa, kích thước của mỗi băng con được cho bi:

(tbx1 – tbx0, tby1 – tby0, tbz1 – tbz0)                               (B-14)

B.6  Phân chia các mc phân giải thành các phân khu

Đây là nội dung cập nhật B.6 của ISO/IEC 15444-1.

Xét một khối ảnh-thành phần cụ thể và mức phân giải có các tọa độ mẫu biên trong miền ảnh phân giải giảm là (trx0try0trz0) và (trx 1, try1 – 1trz 1), như đã được mô tả  trên. Tương tự vi phương pháp đã được mô tả trong B.6 của ISO/IEC 15444-1, mức phân giải của khối ảnh-thành phần ba chiều được chia thành các phân khu, sử dụng trx0, trx1, try0 và try1, và cả trz0 và trz1. Phân khu này được chốt tại (0, 0, 0), sao cho góc trên bên trái mặt trước của phân khu bất kỳ nào đó khi được phân chia sẽ nằm tại vị trí là các bội số nguyên của (2PPx, 2PPy, 2PPz) với PPxPPy và PPz đã được báo hiệu trong các đoạn nhãn COD hoặc COC. Cũng như đối với PPx và PPy, PPz có th khác nhau đối với mỗi khối ảnh- thành phần và mức phân giải. PPz tối thiểu phải bằng 1 đối với mọi mức phân giải r, trừ khi r = 0 thì PPz được phép bằng 0.

S lượng phân khu của khối ảnh-thành phần tại mức phân giải được cho bi Công thức B-16 của ISO/IEC 15444-1 và bởi công thức sau:

trz1 > trz0

trz1 = trz0

(B-15)

Thậm chí nếu Công thức B-16 của ISO/IEC 15444-1 hoặc B-15 của tiêu chuẩn này chỉ ra rằng cả numprecinctswide, numprecinctshigh, và numprecinctsdeep đều bằng 0, thì một số hoặc tt cả các phân khu đều có thể vẫn trống như đã được giải thích trong B.6 của ISO/IEC 15444-1. Chỉ số phân khu chạy từ 0 đến numprecincts-1 với numprecincts = numprecinctswide·numprecinctshigh·numprecinctsdeep theo thứ tự quét mành (tức là, từ trái sang phải, trên xuống dưới, trước ra sau). Ch số này được sử dụng để xác định thứ tự xuất hiện trong dòng mã của các gói tin tương ứng với từng phân khu, như đã được giải thích trong B.12 của ISO/IEC 15444-1.

B.7  Phân chia các băng con thành các khối mã

Đây là nội dung cập nhật B.7 của ISO/IEC 15444-1.

Các băng con được phân chia thành các khối mã 3D dạng khối chữ nhật để dùng cho mục đích mô hình hóa và mã hóa hệ số. Kích thước của mỗi khối mã được xác định từ ba tham sxcbycb và zcb, như đã được báo hiệu trong các đoạn nhãn COD hoặc COC. Kích thước khối mã đối với từng băng con tại một mức phân giải nhất định được xác đnh là 2xcb’ x 2ycb’ x 2zcb’ với xcb và ycb’ được mô tả trong Công thức B-17 và B-18 của ISO/IEC 15444-1 và zcb’ được cho bi:

zcbʹ =

r > 0

(B-16)

r = 0

Các công thức này phn ánh một thực tế là kích thước khối mã bị giới hạn bi cả kích thước phân khu và kích thước khối mã, trong đó các tham số của chúng, xcbycb và zcb, là đồng nhất cho mọi băng con trong khối ảnh-thành phần. Giống như đối với phân khu, việc phân chia khối mã được chốt tại (0, 0, 0). Do đó, tất cả các biên của khối mã tham gia vào việc phân chia sẽ có vị trí tại x = gx2xcbʹy = gy2ycbʹ và z = gz2zcbʹ với gxgy và gz là các số nguyên.

B.8  Gói tin

Đây là nội dung cập nhật B.9 của ISO/IEC 15444-1.

Mọi dữ liệu ảnh nén thể hiện một khối ảnh, lớp, thành phần, mức phân giải và phân khu nào đó xuất hiện trong dòng mã trong một đoạn tiếp giáp đều được gọi là gói tin. Dữ liệu gói tin được phân định tại các biên 8-bit (một byte).

Như được xác định trong Phụ lục D, mức phân giải r = 0 chứa các hệ số băng con của băng NLLLL, với NL là số lượng mức phân tách được xác định trong D.3.2. Mỗi mức phân giải tiếp theo, r > 0, chứa các hệ số băng con của các băng con n[L|H|X][L|H|X][L|H|X], trừ nLLL, như được xác định trong Phụ lục D, với n = NL – r + 1. Mỗi khối ảnh-thành phần có NL mức phân tách sẽ có (NL + 1) mức phân giải.

Dữ liệu ảnh nén trong mỗi gói tin được lập thứ tự sao cho sự đóng góp từ các băng con LLL, XLL, LXL, LLX, LXX, XLX, XXL, HLL, HXL, HLX, HXX, LHL, XHL, LHX, XHX, HHL, HHX, LLH, XLH, LXH, XXH, HLH, HXH, LHH, XHH và HHH cũng xuất hiện theo thứ tự đó (tức là, thứ tự quét Morton). Trong mỗi băng con, các đóng góp của khối mã xuất hiện theo thứ tự quét mành, giới hạn ở các biên được thiết lập bởi phân vùng liên quan. Mức phân giải r = 0 chỉ chứa băng NLLLL và các mức phân giải r > 0 có th chỉ chứa một vài trong số NL[L|H|X][L|H|X][L|H|X] băng, trừ NLLLL. Chỉ các khối mã chứa các mẫu từ băng con liên quan, giới hạn trong phân vùng, mới có mặt trong gói tin đó.

Dữ liệu gói tin được chứa trong phần tiêu đề gói tin có cú pháp mô tả trong B.10 của ISO/IEC 15444-1 và sau đó là thân gói tin chứa các byte mã thực tế được đóng góp bi từng khối mã liên quan. Thứ tự xác định ở trên được tuân thủ trong việc xây dựng cả tiêu đề gói tin và thân gói tin.

B.9  Mã hóa thông tin tiêu đề gói tin

Cập nhật của B.10 của ISO/IEC 15444-1.

B.9.1  Cây thẻ

B.10.2 của T.8001 | ISO/IEC 15444-1 mô tả các cây thẻ hai chiều. Các cây thẻ ba chiều được yêu cầu cho mục đích m rộng ba chiều.

Cây thẻ 3D là cách thể hiện mảng ba chiều của các số nguyên không âm theo phương thức phâcấp.

Cây thẻ 3D lần lượt thiết lập các mức phân giải giảm dần của mảng ba chiều, hình thành một cây. Tại mọi điểm của cây, số nguyên nhỏ nhất của các điểm đỉnh (tối đa là 8) bên dưới được ghi lại. Ký hiệu qi(mx, my, mz) là giá trị tại điểm thứ mx từ phía trái, thứ my từ trên và thứ mz từ mặt trước, ở mức thứ i. Mức 0 là mức thấp nhất của cây thẻ và chứa đim cao nhất.

Xem B.10.2 của ISO/IEC 15444-1 để có thêm thông tin về cách thức mã hóa và giải mã thực tế cho các giá trị theo cây thẻ. Các mô tả trong tài liệu này không phụ thuộc vào số lượng chiều thực tế.

B.9.2  Thứ tự thông tin trong gói tin

Đây là nội dung cập nhật B.10.8 của ISO/IEC 15444-1.

Dưới đây là thứ tự thông tin tiêu đề gói tin của gói tin thuộc một lớp, khối ảnh-thành phần, mức phân giải và phân vùng nhất định.

bit đối với gói có độ dài bằng 0 hoặc khác 0

đối với từng băng con ([L|H|X][L|H|X][L|H|X])

đối với tất cả các khối mã trong băng con này được giới hạn trong phân khu ảnh liên quan, theo thứ tự quét mành

các bit bao hàm khối mã (nếu không bao gồm trước đây thì là cây ghi nhãn hoặc một bit) nếu khối mã bao gồm

nếu đối tượng đầu tiên của khối mã

thông tin mặt phẳng bit

số lượng bước mã hóa bao gồm

tăng chỉ số độ dài khối mã (Lblock)

đối với từng đoạn từ mã

chiều dài đoạn từ mã

B.10  Thứ tự lũy tiến

Đây là nội dung cập nhật B.12 của ISO/IEC 15444-1.

Đối với mỗi khối ảnh-bộ phận, các gói tin đều chứa tất cả các dữ liệu ảnh nén từ một lớp, một thành phần, một mức phân gii, và một phân vùng cụ thể. Thứ tự xuất hiện của các gói tin này trong dòng mã được gọi là thứ tự lũy tiến. Việc lập thứ tự các gói tin có thể thực hiện trên bốn trục: lớp, thành phần, mức phân giải và phân khu.

Các thành phần có thể có số lượng mức phân giải khác nhau. Trong trường hợp này, mức phân giải tương ứng với băng con NLLLL là mức phân giải đầu tiên (r = 0) đối với mọi thành phần. Các chỉ số đưc đồng bộ từ điểm này trở đi.

B.10.1  Xác định thứ tự lũy tiến

Phần này mô tả các thuật toán xác định năm thứ tự lũy tiến có thể. Về cơ bản, chúng giống các thuật toán đã đưc mô tả trong B.12.1 của ISO/IEC 15444-1, nhưng được mở rộng thành ba chiều. Các đường nét đậm chỉ ra các bổ sung cần thiết cho chiều thứ ba.

Các đoạn nhãn COD báo hiệu thứ tự được sử dụng trong số năm thứ tự lũy tiến (xem A.6.1 của ISO/IEC 15444-1). Thứ tự lũy tiến có thể còn bị ghi đè với đoạn nhãn POC (xem A.6.6 của ISO/IEC 15444-1) trong mọi tiêu đề khối ảnh-bộ phận. Đối với mỗi th tự lũy tiến có thể, cơ chế để xác định thứ tự lũy tiến của các gói tin sẽ được mô tả dưới đây.

B.10.1.1  Lũy tiến lớp-mức phân giải-thành phần-vị trí

Xem B.12.1.1 của ISO/IEC 15444-1.

B.10.1.2  Lũy tiến mức phân giải-lớp-thành phần-v trí

Xem B.12.1.2 của ISO/IEC 15444-1.

B.10.1.3  Lũy tiến mức phân giải-vị trí-thành phần-lớp

Lũy tiến mức phân giải-vị trí-thành phần-lớp đối với ba chiều được định nghĩa là sự chèn các gói tin theo thứ tự sau:

đối với mỗi r = 0,…, Nmax

đối với mỗi z = tz0,…, tz1 – 1,

đối với mỗi y = ty0,…, ty1 – 1,

đối với mỗi x = tx0,…, tx1 – 1,

đối với mỗi i = 0,…, Csiz – 1

nếu ((z chia hết cho ZRsiz(i) ) OR ((z = tz­0) AND (trz0 x  

không chia hết cho )))

nếu ((y chia hết cho YRsiz(i) x ) OR ((y = ty0) AND (try0 x  

không chia hết cho )))

nếu ((x chia hết cho XRsiz(i) x ) OR ((x = tx0) AND (trx0 x  

không chia hết cho )))

đối với phân khu ảnh kế tiếp, k, nếu nó tồn tại,

đối với mỗi I = 0,…, L-1

gói cho thành phần ảnh I, mức phân giải r, lp ảnh I, và phân khu ảnh k

Trong đó, k có thể thu được từ công thức sau:

(B-17)

Để áp dụng lũy tiến này, các giá trị XRsizYRsiz và ZRsiz phải là lũy thừa hai đối với mỗi thành phần.

B.10.1.4  Lũy tiến v trí-thành phần-mức phân giải-lớp

Lũy tiến vị trí-thành phần-mức phân giải-lớp được định nghĩa là sự chèn các gói tin theo thứ tự sau:

đối với mỗi z = tz0,…, tz 1,

đối với mỗi = ty0,…, ty 1,

đối vi mỗi = tx0,…, tx 1,

đối với mỗi i = 0,…, Csiz – 1

đối với mỗi r = 0,…, Nmax, với NL là số mức phân tách đối với thành phần I,

nếu ((z chia hết cho ZRsiz(i) x ) OR ((z = tz0) AND (tz0 x 

không chia hết cho )))

nếu ((y chia hết cho YRsiz(i) x ) OR ((y = ty0) AND (try0 X 

không chia hết cho )))

nếu ((x chia hết cho XRsiz(i) x ) OR ((x = tx0) AND (trx0 x 

không chia hết cho )))

đối với phân khu ảnh kế tiếp, k, nếu nó tồn tại,

đối vi mỗi I = 0,..., L-1

gói cho thành phần ảnh I, mức phân giải r, lớp ảnh l, và phân khu ảnh k

Trong đó, k có thể được nhận từ Công thức B-17. Để áp dụng lũy tiến này, các giá trị XRsizYRsiz và ZRsiz phải là lũy thừa hai đối với mỗi thành phần.

B.10.1.5  Lũy tiến thành phần-v trí-mức phân giải-lớp

Lũy tiến thành phần-vị trí-mức phân giải-lớp được định nghĩa là sự chèn các gói tin theo thứ tự sau:

đối với mỗi i = 0,…, Csiz -1

đối với mỗi z = tz0,…, tz– 1,

đối với mỗi = ty0,…, ty– 1,

đối với mỗi = tx0,…, tx– 1,

đối với mỗi r = 0,…, Nmax, với NL là số mức phân tách đối với thành phần I,

nếu ((z chia hết cho ZRsiz(i) ) OR ((z = tz0) AND (trz0 x 

không chia hết cho )))

nếu ((y chia hết cho YRsiz(i) x ) OR ((y = ty0) AND (try0 

không chia hết cho )))

nếu ((x chia hết cho XRsiz(i) x ) OR ((x = tx0) AND (trx0 

không chia hết cho )))

đối với phân khu ảnh kế tiếp, k, nếu nó tồn tại,

đối với mỗi I = 0,…, L  1

gói cho thành phần ảnh I, mức phân giải r, lớp ảnh l, và phân khu ảnh k

Trong đó, k có thể nhận được từ Công thức B-17.

 

Phụ lục C

(Quy định)

Mô hình hóa bit hệ số

C.1. Giới thiệu

Trong phụ lục này và các điều nhỏ của phụ lục, các sơ đồ và bảng ch có tính bắt buộc nếu chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này chính thức mở rộng Phụ lục D của ISO/IEC 15444-1 thêm tính năng mã hóa khối

Phụ lục này đề cập đến việc mô hình hóa và quét các bit hệ số biến đổi.

Các khối mã (xem Phụ lục B) được mã hóa phẳng bit tại một thời điểm tính từ mặt phẳng bit có ý nghĩa cao nhất có một phần tử khác 0 đến mặt phng bit có ý nghĩa thấp nhất. Đối với mỗi mặt phẳng bit trong khối mã, một kiểu quét khối mã đặc biệt được sử dụng cho mỗi quá trình mã hóa trong ba quá trình mã hóa. Mỗi bit hệ số trong mặt phẳng bit chỉ xuất hiện trong một trong ba thẻ mã hóa được gọi là lan truyền có nghĩa, tinh chnh biên độ và làm sạch. Đối với mỗi thẻ, các ngữ cảnh được thiết lập cho bộ mã hóa và giải mã số học, CX, cùng với dòng bit, CD (xem C.3 của. ISO/IEC 15444-1).

C.2. Kiểu quét khối mã trong các khối mã, phần mở rộng

Mỗi mặt phẳng bit của một khối mã đều được quét theo một thứ tự riêng. Khối mã 3D được xử lý theo sọc, mỗi sọc, chứa bốn hàng (hoặc tất cả các hàng còn lại nếu ít hơn bốn) và trải theo chiều rộng của khối mã 3D. Mỗi sọc được xử lý theo từng cột từ trên xuống dưới và từ trái sang phải. Do đó, toàn bộ khối mã 3D được quét theo từng lát ảnh. Trong mỗi lát ảnh, tuân thủ theo ISO/IEC 15444-1.

C.3. Các cập nhật về mô hình ngữ cảnh

Đối với việc mô hình hóa ngữ cảnh, mô hình được mô tả trong Phụ lục D của ISO/IEC 15444-1 được thay đổi theo các quá trình mã hóa lan truyền có nghĩa và làm sạch.

Vectơ ngữ cảnh đối với một hệ số hiện tại cụ thể là vectơ nhị phân gồm các trạng thái trọng số của 8 hệ số bên cạnh gần nhất trong mặt phẳng XY, như mô tả trong Hình D.2 của ISO/IEC 15444-1. Mọi hệ số bên cạnh gần nhất nằm ngoài khối mã của hệ số hiện tại đều được coi là không có nghĩa (tức là, chúng được coi như có trạng thái trọng số bằng 0) khi thiết lập vectơ ngữ cảnh để giải mã hệ số hiện tại.

Thay cho Bảng D.1 của ISO/IEC 15444-1, các ngữ cảnh liên quan được quy định trong Bảng C.1 bên dưi.

Bảng C.1 – Các ngữ cảnh đối với các quá trình mã hóa lan truyền có nghĩa và làm sạch

Các băng con có đnh hướng chính L[L|H|X][L|H|X], X[L|H][L|H|X] hoặc XX[L|H]

Các băng con có định hướng chính H[L|X][L|H|X]

Các băng con có định hướng chính HH[L|H|X]

Nhãn ngữ cảnha)

 

2

xb)

x

x

2

x

x

 3

8

1

≥ 1

x

≥ 1

1

x

≥ 1

2

7

1

0

≥ 1

0

1

≥ 1

0

2

6

1

0

0

0

1

0

 2

1

5

0

2

x

2

0

x

1

1

4

0

1

x

1

0

x

0

1

3

0

0

 2

0

0

≥ 2

 2

0

2

0

0

1

0

0

1

1

0

1

0

0

0

0

0

0

0

0

0

a) Lưu ý rằng các nhãn ngữ cảnh được đánh số ch để tiện lợi trong việc định danh ở tiêu chuẩn này. Các định danh thực tế sẽ cần được xem xét khi triển khai.

b) x = “không quan tâm”.

 

Phụ lục D

(Quy định)

Biến đổi sóng con rời rạc của các khối ảnh – thành phần

D.1  Giới thiệu

Trong phụ lục này và các điều nhỏ của phụ lục, các lưu đồ và bảng ch có tính bắt buộc khi chúng ch rõ đầu ra mà các triển khai khác sẽ phải tuân thủ.

Phụ lục này mô tả biến đổi sóng con rời rạc thuận ba chiều được áp dụng cho mỗi khối ảnhthành phần và chỉ rõ biến đổi sóng con rời rạc ngược ba chiều được sử dụng để phục dựng khối ảnh-thành phần [3], [4] và [5]. Về cơ bn, phụ lục này m rộng Phụ lục F của ISO/IEC 15444-1 thêm chức năng mã hóa khối.

D.2  Các tham số khối ảnh-thành phần

Xét khối ảnh-thành phần được xác định bi các tọa độ tcx0, tcx1, tcy0, tcy1, tcz0 và tcz1 cho trong Công thức B-12 của ISO/IEC 15444-1 và Công thức B-9 của tiêu chuẩn này. Khi đó, các tọa độ (x,y,z) của khối ảnh-thành phần (có các giá trị mẫu l(x,y,z)) nằm trong dải xác định bi:

tcx0 ≤ x < tcx1tcy0 ≤ y < tcy1 và tcz0 ≤ z < tcz1                                (D-1)

D.3  Biến đổi sóng con rời rạc

D.3.1  Lọc thông thấp và thông cao (tham khảo)

Xem F.2.1 của ISO/IEC 15444-1.

D.3.2  Các mức phân tách

Mỗi khối ảnh-thành phần được biến đổi thành một tập các tín hiệu băng con ba chiều (được gọi là các băng con), mỗi tín hiệu băng con thể hiện hoạt động của tín hiệu trong các băng tần khác nhau, tại các phân giải không gian khác nhau. NLX biểu thị số lượng mức phân tách theo chiều ngang, NLY biểu thị số mức phân tách theo chiều dọc và NLZ biểu thị số lượng mức phân tách theo chiều trục. Trong tiêu chuẩn nàyNL = max(NLX, NLX, NLX).

D.3.3  Các bộ lọc sóng con rời rạc (tham khảo)

Xem F.2.3 của ISO/IEC 15444-1.

D.4  Biến đổi sóng con rời rạc nghịch

D.4.1  Thủ tục IDWT

Biến đổi sóng con rời rạc nghịch (IDWT) biến đổi một tập các băng con, ab(ub,vb,wb) thành một khối ảnh-thành phần dịch mức DC, l(x, y, z) (thủ tục IDWT). Thủ tục IDWT (xem Hình D.1) có đầu vào là tập các tham số NLXNLY và NLZ, chúng thể hiện số lượng mức phân tách  mỗi chiều của ba chiu và được báo hiệu trong các nhãn COD hoặc COC (xem A.2.2 và A.2.3).

Hỉnh D.1 – Các đầu vào và đu ra của thủ tục IDWT

Các băng con được gán nhãn theo cách sau: một chỉ số lev tương ứng với mức phân tách, tiếp đó là ba chữ cái trong số L, H hoặc X. Do đó, mỗi nhãn băng con sẽ có dạng Iev[L|H|X][L|H|X][L|H|X].

Băng con b = Iev[L|X][L|X][L|X] tương ứng với một phiên bản giảm kích thước của băng con (lev 1)[L|X][L|X][L|X] qua lọc thông thấp cho các hướng (ngang, dọc và/hoặc trục) thể hiện bằng chữ cái L. Nếu tại mức phân tách (lev – 1), một hướng nào đó không được lọc thông thấp (tức là, chữ cái X được sử dụng), thì tín hiệu có th không được lọc thông thấp nữa  mọi mức phân tách cao hơn tiếp theo, n > (lev – 1). Do đó, khi số lượng phân tách  hưng d (vd là X, Y hoặc Z), NLd nhỏ hơn lev thì loại phân tách của chiều tương ứng là X; ngược lại sẽ là L. Băng con b = 0LLL tương ứng với khối ảnh- thành phần ban đầu.

Tương tự như F.3.1 của ISO/IEC 15444-1, các băng con được báo hiệu trong dòng mã theo thứ tự như sau:

NLLLL, NLXLL, NLLXL, NLLLX, NLLLXNLXLX, NLXXL, NLHLL, NLHXL, NLHLX, NLHXX, NLLHL, NLXHL, NLLHX, NLXHX, NLHHL, NLHHX, NLLLH, NLXLH, NLLXH, NLXXH, NLHLH, NLHXH, NLLHH, NLXHH, NLHHH, (NL-1)HHL, (NL-1)HXL, (NL-1)HLX, (NL-1)HXX, (NL-1)LHL, (NL-1)XHL, (NL-1)LHX, …, 1XHX, 1HHL, 1HHX, 1LLH, 1XLH, 1LXH, 1XXH, 1HLH, 1HXH, 1LHH, 1XHH, 1HHH.

Lưu ý rằng, trong danh sách các băng con  trên, chỉ các băng con tồn tại, có các tham số NLXNLY và NLZ, là sẽ có mặt trong dòng mã. Đây là các băng con chính xác cần để phục dựng đầy đủ khối ảnh- thành phần ban đầu.

Hình D.2 – Thủ tục IDWT

Như trong F.3.1 của ISO/IEC 15444-1, thủ tục IDWT bắt đầu với việc khơi tạo biến lev (mức phân tách hiện tại) thành NL. Thủ tục 3D_SR (xem D.4.2) được thực hiện tại mọi mức lev, với mức lev giảm  mỗi lần lặp, cho đến khi NL lần lặp được hoàn tất. Thủ tục 3D_SR được lặp lại ở băng con lev[L|X][L|X][L|X] sinh ra tại mỗi lần lặp.

Cuối cùng, băng con a­0LLL(u0LLL,u1LLL,v0LLL,v1LLL,w0LLL,w1LLL) sẽ là mảng đầu ra l(x, y, z).

Như đã được đnh nghĩa trong Công thức B-12, chỉ số của các hệ số băng con đối với một băng con b nhất định sẽ nằm trong dải được xác định bởi:

tbx0 ≤ ub < tbx1, tby0 ≤ v < tby1 và tbz0 ≤ wb < tbz1                          (D-2)

D.4.2  Thủ tục 3D_SR

Thủ tục 3D_SR thực hiện phục dựng băng con a(lev-1)[L|X][L|X][L|X](u,v,w) từ các băng con alev[L|H|X][L|H|X][L|H|X](u,v,w) nhất định. Đầu vào của 3D_SR là tổng số lượng hệ số của băng con (lev– 1)[L|X][L|X][L|X] được phục dựng và bằng tổng các tổng số lượng hệ số của các băng con được sử dụng.

Hình D.3 – Các đầu vào và đầu ra của thủ tục 3D_SR

Các băng con alev[L|H|X][L|H|X][L|H|X](u,v,wđưc hợp nhất thành mảng a(u,v,w) bằng thủ tục TO_ARRAY. Mảng tạm thời này được sử dụng để khôi phục các kết quả trung gian và được cập nhật ngay khi thủ tục 3D_SR được thực thi. Tiếp theo, thủ tục 3D_SR sẽ phục dựng mỗi hướng d, trong đó lev < NLd ≤ NL với d là X, Y hoặc Z, bằng các thủ tục tương ứng HOR_SR, VER_SR và AXIAL_SR. Kết quả cuối cùng là băng con a(lev-1)[L|X][L|X][L|X](u,v,w). Hình D.4 mô tả chi tiết thủ tục 3D_SR.

Hình D.4 – Thủ tục 3D_SR

D.4.3  Thủ tục TO_ARRAY

Như mô tả trong Hình D.6, thủ tục TO_ARRAY thực hiện với tất cả các băng con của mức phân tách lev và hợp nhất chúng thành một mảng ba chiều a(u,v,w). Thủ tục này có đầu vào là các băng con alev[L|H|X][L|H|X][L|H|X](u,v,wvà khoảng hệ số theo chiều ngang, dọc và trục của băng con a(lev-1)[L|X][L|X][L|X](u,v,w) là u0,u1,v0,v1,w0 and w1. Mảng đầu ra có khoảng hệ số theo chiều ngang, dọc và trục là u0 ≤ u < u1v0 ≤ v < v1 và w0 ≤ w < w1.

Hình D.5 – Các đầu vào và đầu ra của thủ tục TO_ARRAY

Hình D.6 – Các cấu hình băng con có thể đối với 3D DWT

D.4.4  Thủ tục 1D_INTERLEAVE

Như được th hiện trên Hình D.7, thủ tục 1D_INTERLEAVE chèn các hệ số thông thấp và thông cao của biến đổi sóng con. Thủ tục này có đầu vào là một tín hiệu một chiều Y(n) và sp xếp lại các giá trị hệ số trong tín hiệu bằng cách chèn chúng. Các giá trị của i0 và i1 tương ứng được sử dụng bi thủ tục 1D_INTERLEAVE thể hiện sự bắt đầu và kết thúc của tín hiệu. Cách thức mà tín hiệu được chèn đ hình thành đầu ra được mô tả bi thủ tục 1D_INTERLEAVE, như trong Hình D.8.

Hình D.7 – Các tham số của thủ tục 1D_INTERLEAVE

Hình D.8 – Thủ tục 1D_INTERLEAVE

D.4.5  Thủ tục HOR_SR

Thủ tục HOR_SR thực hiện việc chèn và phục dựng băng con theo chiều ngang của mảng hệ số ba chiều. Thủ tục này có đầu vào là mng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của màng là u0 ≤ u < u1v0 ≤ v < v1 và w0 ≤ w < w1 (xem Hình D.9) và sinh ra đầu ra là một phiên bản lọc theo chiều ngang của mảng đầu vào cho từng hàng và từng lát ảnh.

Hình D.9 – Các đầu vào và đầu ra của thủ tục HOR_SR

Như thể hiện trên Hình D.10, thủ tục HOR_SR áp dụng việc phục dựng băng con một chiều (thủ tục 1D_SR) cho mỗi hàng của mảng đầu vào a(u,v,w), và khôi phục kết quả tr lại mỗi hàng.

Hình D.10 – Th tục HOR_SR

D.4.6  Thủ tục VER_SR

Thủ tục VER_SR thực hiện việc chèn và phục dựng băng con theo chiều dọc của mảng hệ số ba chiều. Thủ tục này có đầu vào là mảng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của màng là u0 ≤ u < u1v0 ≤ v1 và w0 ≤ w < w1 (xem Hình D.11) và sinh ra đầu ra là phiên bản lọc theo chiều ngang của mảng đầu vào cho từng cột và từng lát nh.

Như được thể hiện trên Hình D.12, thủ tục VER_SR áp dụng việc phục dựng băng con một chiều (thủ tục 1D_SR) cho mỗi cột của mảng đầu vào a(u,v,w), và khôi phục kết quả trở lại mỗi cột.

Hình D.11 – Các đầu vào và đầu ra của thủ tục VER_SR

Hình D.12 – Thủ tục VER_SR

D.4.7  Thủ tục AXIAL_SR

Thủ tục AXIAL_SR thực hiện việc chèn và phục dựng băng con theo trục của mảng hệ số ba chiều. Thủ tục này có đầu vào là một mảng ba chiều a(u,v,w), với khoảng hệ s theo chiều ngang, dọc và trục của mảng là u0 ≤ u < u1v0 ≤ v < v1 và w0 ≤ w < w1 (xem Hình D.13) và sinh ra đầu ra là phiên bản lọc theo chiều ngang của mảng đầu vào cho từng hàng và từng cột.

Như được mô tả trên Hình D.14, thủ tục AXIAL_SR áp dụng việc phục dựng băng con một chiều (thủ tục 1D_SR) cho mỗi chiều sâu của mảng đầu vào a(u,v,w), và khôi phục kết quả tr lại trong mỗi chiều sâu.

Hình D.13 – Các đầu vào và đầu ra của thủ tục AXIAL_SR

Hình D.14 – Thủ tục AXIAL_SR

D.4.8  Thủ tục 1D_SR

F.3.6 của ISO/IEC 15444-1 đã mô tả thủ tục 1D_SR được sử dụng để thực hiện phục dựng băng con. Ngoài ra, tất cả các thủ tục và mô tả tiếp theo, dù trực tiếp hoặc gián tiếp được yêu cầu bởi thủ tục 1D_SR, cũng đã được đề cập trong Phụ lục F của ISO/IEC 15444-1.

D.5  Biến đổi thuận (tham khảo)

D.5.1  Thủ tục FDWT (tham khảo)

Biến đổi sóng con rời rạc thuận (FDWT) biến đi các mẫu khối ảnh-thành phần dịch mức DC l(x,y,z) thành một tập các băng con có các hệ số ab(ub,v­b,w­b) (thủ tục FDWT). Thủ tục FDWT (xem Hình D.15) có đầu vào là số lượng mức phân tách trong mỗi chiều của ba chiều và đã được báo hiệu trong các nhãn COD hoặc COC (xem A.2.2 và A.2.3).

Như trong F.4.1 của 1SO/IEC 15444-1 đã đề cập, thủ tục FDWT bắt đầu với việc khởi tạo biến lev (mức phân tách hiện tại) thành 1 và phân bổ mng ba chiều l(x,y,z) vào băng con a0LLL(u0LLL,u1LLL,v0LLL,v1LLL,w0LLL,w1LLL). Thủ tục 3D_SD (xem D.5.2) được thực hiện tại mọi mức lev, trong đó mức Iev tăng thêm một ở mỗi lần lặp cho đến khi N­L lần lặp hoàn tất. Th 3D_SD được lặp lại trên toàn băng con (lev-1)[L|X][L|X][L|X] được sinh ra tại mỗi lần lặp.

Toàn bộ thủ tục FDWT được mô tả chi tiết trên Hình D.16.

Tương tự với những gì đã được mô tả trong Phụ lục F của ISO/IEC 15444-1, các băng con được sinh ra sẽ được báo hiệu trong dòng mã theo thứ tự dưới đây:

NLLLL, NLXLL, NLLXL, NLLLX, NLLXX, NLXLXNLXXL, NLHLL, NLHXL, NLHLX, NLHXX, NLLHL, NLXHL, NLLHX, NLXHX, NLHHL, NLHHX, NLLLH, NLXLH, NLLXH, NLXXH, NLHLH, NLHXH, NLLHH, NLXHH, NLHHH, (NL-1)HLL, (NL-1)HXL, (NL-1)HLX, (NL-1)HXX, (NL-1)LHL, (NL-1)XHL, (NL-1)LHX, …., 1XHX, 1HHL, 1HHX, 1LLH, 1XLH, 1LXH, 1XXH, 1HLH, 1HXH, 1LHH, 1XHH, 1HHH.

Lưu ý rằng, trong danh sách các băng con  trên, chỉ các băng con tồn tại, có các tham số NLXNLY và NLZ, là sẽ có mặt trong dòng mã. Đây là các băng con chính xác cần thiết để phục dựng đầy đủ khối ảnh-thành phần. Cũng lưu ý thêm rằng, NL[L|X][L|X][L|X] chỉ là băng con loại [L|X][L|X][L|X] đã được báo hiệu trong dòng mã.

Hình D.15 – Các đầu vào và đầu ra của thủ tục FDWT

Hình D.16 – Thủ tục FDWT

D.5.2  Thủ tục 3D_SD (tham khảo)

Thủ tục 3D_SD thực hiện việc phân tách mảng hệ số hoặc mẫu ba chiều a(lev-1)[L|X][L|X][L|X](u,v,w) thành nhiều nhóm các hệ số băng con alev[L|H|X][L|H|X][L|H|X](u,v,w), tùy thuộc vào số lượng phân tách NLXNLY và NLZ.

Tổng số lượng hệ số của băng con (lev– 1)[L|X][L|X][L|X] bằng tổng các tng số lượng hệ số của các băng con lev[L|H|X][L|H|X][L|H|X] sinh ra từ thủ tục 3D_SD.

Hình D.17 – Các đầu vào và đầu ra của thủ tục 3D_SD

Thủ tục 3D_SR (xem Hình D.18) phân tách mỗi hưng, d, trong đó mỗi hướng có lev < NLd  NL, với d là X, Y hoặc Z, tương ứng bằng các thủ tục HOR_SD, VER_SD và AXIAL_SD. Tiếp theo, mảng ba chiều a(u,v,w) được chia thành các băng con được phục dựng khác nhau alev[L|H|X][L|H|X][L|H|X](u,v,w). Trong các băng con này, băng con lev[L|X][L|X][L|X] được sử dụng  lần lặp tiếp theo của thủ tục FDWT để tiếp tục được phân tách (miễn sao có ít hơn NL lần lặp). Các băng con khác tiếp tục được xử lý để báo hiệu trong dòng mã.

Hình D.18 – Thủ tục 3D_SD

D.5.3  Thủ tục TO_SUBBANDS (tham khảo)

Thủ tục TO_SUBBANDS có đu vào là mảng ba chiều a(u,v,w) và đầu ra là các băng con sau khi đã được hoàn lại, như được mô tả trong Hình D.6. Mảng a(u,v,w) có khoảng hệ số theo chiều ngang, dọc và trục là u0 ≤ u < u1v0 ≤ v < v1 và w0 ≤ w < w1.

D.5.4  Thủ tục AXIAL_SD (tham khảo)

Thủ tục AXIAL_SD thực hiện việc phân tách băng con của mảng hệ số ba chiều theo trục. Thủ tục này có đầu vào là mảng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của mảng là u0 ≤ u < u1v0 ≤ v < v1 và w0 ≤ w < w1 (xem Hình D.19) và sinh ra đầu ra là phiên bản lọc theo trục của mảng đầu vào, cho từng hàng và từng cột. Sau phân tách là quá trình giải lặp.

Như được mô tả trên Hình D.20, thủ tục AXIAL_SD áp dụng việc phân tách băng con một chiều (thủ tục 1D_SD) cho mỗi chiều sâu của mảng đầu vào a(u,v,w), và khôi phục kết quả ở lại cho mỗi chiều sâu.

Hình D.19 – Các đầu vào và đầu ra của thủ tục AXIAL_SD

Hình D.20 – Thủ tục AXIAL_SD

D.5.5  Thủ tục VER_SD (tham khảo)

Thủ tục VER_SD thực hiện việc phân tách băng con của mảng hệ số ba chiều theo chiều dọc. Thủ tục này có đầu vào là mảng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của mảng là u0 ≤ u < u1v0 ≤ v < v1 và w0 ≤ w < w1 (xem Hình D.21) và sinh ra đầu ra là một phiên bản lọc theo chiều dọc của mảng đầu vào, cho từng cột và từng lát ảnh. Sau phân tách là quá trình giải chèn.

Như được mô tả trên Hình D.22, thủ tục VER_SD áp dụng việc phân tách băng con một chiều (thủ tục 1D_SD cho mỗi cột của mảng đầu vào a(u,v,w), và khôi phục kết quả tr lại trong mỗi cột.

Hình D.21 – Các đầu vào và đầu ra của thủ tục VER_SD

Hình D.22 – Thủ tục VER_SD

D.5.6  Thủ tục HOR_SD (tham khảo)

Thủ tục HOR_SD thực hiện việc phân tách băng con của mảng hệ số ba chiều theo chiều ngang. Thủ tục này có đầu vào là mảng ba chiều a(u,v,w), với khoảng hệ số theo chiều ngang, dọc và trục của mảng là u0 ≤ u < u1v0 ≤ v < v1 và w0 ≤ w < w1 (xem Hình D.23) và sinh ra đầu ra là một phiên bản lọc theo chiều ngang của mảng đầu vào, cho từng hàng và từng lát ảnh. Sau phân tách là quá trình giải chèn.

Như đưc mô tả trên Hình D.24, thủ tục HOR_SD áp dụng việc phân tách băng con một chiều (thủ tục 1D_SD) lên mỗi hàng của mảng đầu vào a(u,v,w), và khôi phục kết quả tr lại trên mỗi hàng.

Hình D.23 – Các đầu vào và đầu ra của thủ tục HOR_SD

Hình D.24 – Thủ tục HOR_SD

D.5.7  Thủ tục 1D_DEINTERLEAVE (tham khảo)

Như được mô tả trên Hình D.25, thủ tục 1D_DEINTERLEAVE giải chèn các hệ số thông thấp và thông cao của biến đổi sóng con. Thủ tục này có đầu vào là tín hiệu một chiều, X(n), và sắp xếp lại các giá trị hệ số trong tín hiệu bằng cách giải chèn chúng. Các giá trị của i0 và i1 tương ứng được sử dụng bởi thủ tục 1D_DEINTERLEAVE thể hiện sự bắt đầu và kết thúc của tín hiệu. Cách thức mà tín hiệu được giải chèn để hình thành đầu ra được mô tả bi thủ tục 1D_DEINTERLEAVE như trên Hình D.26.

Hình D.25 – Các tham số ca thủ tục 1D_DEINTERLEAVE

Hình D.26 – Thủ tục 1D_DEINTERLEAVE

D.5.8  Thủ tục 1D_SD (tham khảo)

F.4.6 của ISO/IEC 15444-1 đã mô tả thủ tục 1D_SD được sử dụng để thực hiện việc phân tách băng con. Ngoài ra, tất cả các thủ tục và đặc tả tiếp theo, dù trực tiếp hoặc gián tiếp cần cho thủ tục 1D_SD, cũng đã được cho trong Phụ lục F của ISO/IEC 15444-1.

 

Phụ lục E

(Quy định)

Lượng tử hóa

E.1 Giới thiệu

Trong phụ lục này và các điều nhỏ của phụ lục, các lưu đồ và bảng chỉ có tính bắt buộc khi chúng chỉ rõ đầu ra mà các triển khai khác phải tuân thủ. Phụ lục này quy đnh các khía cạnh liên quan đến sự lượng tử hóa của các hệ số biến đi khối ảnh-thành phần. Các khía cạnh lượng t hóa đã được chỉ rõ trong Phụ lục E của ISO/IEC 15444-1, nhưng sẽ được mở rộng để định nghĩa sự lượng tử hóa các phân tách ba chiều trong tiêu chuẩn này.

E.2  Các biến thể của thủ tục lượng tử hóa nghịch

Thủ tục lượng tử hóa sẽ phải giống như đã quy định trong Phụ lục E của ISO/IEC 15444-1, ngoại trừ những sửa đổi ở đây nhằm phù hợp với các cấu trúc phân tách ba chiều của tiêu chun này.

Các băng con cũng giống như đã được chỉ rõ trong Phụ lục E của ISO/IEC 15444-1, ngoại trừ việc có nhiều băng con hơn cho các phân tách ba chiều (tức là, [L|X|H][L|X|H][L|X|H] trừ XXX).

Các độ lợi băng con được chỉ rõ trong Bảng E.1 dưới đây thay cho Bảng E.1 của ISO/IEC 15444-1.

Bảng E.1 – Độ lợi băng con

Loại băng con

Độ lợib

log2(độ lợib)

LLL, LXX, XLX, XXL, LXL, LLX, XLL

1

0

H[L|X][L|X], [L|X]H[L|X], [L|X][L|X]H

2

1

HH[L|X], H[L|X]H, [L|X]HH

4

2

HHH

8

3

Đối với các cấu trúc phân tách ba chiều như đã được xác định trong tiêu chuẩn này, giá trị nb trong Công thức E-5 của ISO/IEC 15444-1 biểu thị số lượng mức phân tách lớn nhất trong mỗi hướng không gian từ khối ảnh-thành phần ban đầu đến băng con b (tức là, nb = max(nxbnybnzb), với nxbnyb và nzb được xác định bởi Công thức B-13).

 

Phụ lục F

(Quy định)

Mã hóa ảnh theo vùng quan tâm, phần mở rộng

F.1  Giới thiệu

Trong phụ lc này và các điều nhỏ của phụ lục, các lưu đồ và bảng ch có tính bắt buộc khi chúng ch rõ đầu ra mà các triển khai khác phải tuân thủ. Phụ lục này mô tả phần m rộng khối của mã hóa theo vùng quan tâm cho cả Phụ lục H của ISO/IEC 15444-1 và Phụ lục L của T.801 ISO/IEC 15444-2.

Phụ lục này mô tả công nghệ vùng quan tâm (ROI) ba chiều. ROI là một phần của ảnh và được mã hóa vi độ trung thực cao hơn phần còn lại của ảnh (ảnh nền). Sự mã hóa cũng được thực hiện theo cách thức sao cho thông tin liên quan đến ROI sẽ đến trước thông tin liên quan đến ảnh nền.

F.2  Gii mã ROI

Các thủ tục được chỉ rõ trong điều này được áp dụng ch trong trường hợp có mặt đoạn nhãn RGN (xem A.2.4), tức là thể hiện sự có mặt của ROI được mã hóa bằng phương pháp dựa trên Maxshift hoặc Scaling.

F.2.1  Giải mã ROI bằng phương pháp Maxshift

Thủ tục này tổ chức lại các bit có trọng số của các hệ số ROI và các hệ số ảnh nền. Thủ tục thực hiện theo các bước sau:

1) Nhận giá trị phân cấp, s, từ tham số SPrgn của đoạn nhãn RGN trong dòng mã (xem A.2.4). Các bước tiếp theo (2, 3 và 4) được áp dụng cho từng hệ số của băng con b.

2) Nếu Nb(u,v,w) < Mb (xem các định nghĩa của N­b trong D.2.1 của ISO/IEC 15444-1 và Mb trong Công thức E-2 của ISO/IEC 15444-1), t sẽ không có sửa đổi nào được thực hiện.

3) Nếu Nb(u,v,w) ≥ Mb và nếu ít nhất có một trong số Mb MSB đầu tiên (i = 1,…, Mb) khác không, thì giá tr của Nb(u,v,w) đưc cập nhật thành Nb(u,v,w) = Mb.

4) Nếu Nb(u,v,w) ≥ Mb và nếu tất cả Mb MSB đầu tiên bằng 0, thì thực hiện các sửa đổi sau:

i) loại bỏ MSB đầu tiên và dịch các MSB còn lại thêm s vị trí, như được mô tả trong Công thức F-1, với i = 1,…, Mb

                    (F-1)

ii) cập nhật giá trị của Nb(u,v,w) như cho bi công thức sau:

Nb(u,v,w) = max(o,N­b(u.v.w) – s)                          (F-2)

F.2.2  Giải mã ROI bằng phương pháp Scaling

Thủ tục này t chức lại các bit trọng số của các hệ số ROI và các hệ số ảnh nền. Thủ tục này thực hiện theo các bước sau:

1) Nhận thông tin kiểu tương ứng và giá trị phân cấp, s, từ đoạn nhãn RGN cho từng ROI. Sau đó, các bước từ 2 đến 6 được áp dụng cho từng hệ số (u,v,w) của băng con b.

2) Tạo mặt nạ ROI {Mi(u,v,w)} cho tất cả ROI, xem F.4.2 để có thông tin chi tiết về cách tạo mặt nạ ROI.

3) Đối với mỗi khối mã, tìm giá trị phân cp lớn nhất smax cho từng hệ số (u,v,w).

4) Đối với mỗi hệ s trong từng khối mã, tìm giá trị phân cấp cao nhất và đặt s(u,v,w) là:

s(u,v,w) = smax – max(si  Mi (u,v,w))                     (F-3)

Với i = 0…(số lượng ROI -1).

5) Đối với mỗi hệ số (u,v,w), loại bỏ s(u,v,w) MSB đầu tiên và dịch các MSB còn lại thêm s(u,v,w) vị trí, như được mô tả trong Công thức F-4, với i = 1,…, Mb:

                        (F-4)

6) Cập nhật giá trị của Nb(u,v,w) như cho trong Công thức F-5:

Nb(u,v,w) = max(0,N­b (u.v.w) – s(u,v,w))                            (F-5)

F.3  Mã hóa ROI (tham khảo)

Điều này mô tả cách thức mã hóa ảnh có một hoặc nhiều ROI bằng phương pháp dựa trên Maxshift hoặc Scaling. Mã hóa được mô tả  đây chỉ là thông tin tham khảoỞ phía bộ mã hóa, mặt nạ ROI được tạo ra thể hiện các hệ số biến đổi lượng tử hóa phải được mã hóa với chất lượng tốt nhất (gần như không tn tht). Mặt nạ ROI là một bản đồ bit mô t các hệ số này.

F.3.1  Mô tả phương pháp Maxshift (tham khảo)

Các hệ số biến đi được lượng tử nằm ngoài mặt nạ ROI, được gọi là các hệ số ảnh nền, được phân cấp giảm dần sao cho các bit liên quan đến ROI đều được đặt trong các mặt phẳng bit cao hơn so với ảnh nền. Điều này nghĩa là khi bộ mã hóa và giải mã entropy mã hóa các hệ số biến đi được lượng tử thì các mặt phẳng bit liên quan đến ROI sẽ được mã hóa trước thông tin liên quan đến ảnh nền. Xem F.4.1 về tạo mặt nạ ROI bằng phương pháp Maxshift.

Phương pháp Maxshift có thể còn được mô tả bằng các bước sau:

1) Tạo mặt nạ ROI, M(x, y, z), xem F.4.1.

2) Tìm giá trị phân cấp s (xem F.3.2).

3) Cộng s LSB vào mỗi hệ số |qb(u,v,w)|. Số lượng mặt phẳng bit biên độ Mb khi đó sẽ là:

Mb = Mb + s                                                          (F-6)

Với Mb được cho bởi Công thức E-2 của ISO/IEC 15444-1 và giá trị mới của mỗi hệ số sẽ được cho bởi:

qb(u,v,w)│ = │qb(u,v,w)│. 2S                                                                        (F-7)

4) Giảm tất cả các hệ số ảnh nền được cho bởi M(x,y,z) sử dụng giá trị phân cấp s (xem F.3.2). Do đó, nếu qb(u,v,w) là hệ số ảnh nền được cho bởi M(x, y, z), thì:

                                          (F-8)

5) Viết giá trị phân cấp s vào dòng mã sử dụng tham số SPrgn của đoạn nhãn RGN.

Sau các bước này thì các hệ số biến đổi được lượng tử đã được mã hóa entropy như bình thường.

F.3.2  Lựa chọn giá tr phân cấp, s, cho phương pháp Maxshift tại phía bộ mã hóa (tham khảo)

Giá trị phân cấp, s, có thể được lựa chọn sao cho Công thức F-9 đúng với đối với mọi hệ số hình nền, qBG(x,y,z) mọi khối mã trong thành phần hiện tại, với max(M­b) là số lượng mặt phẳng bit biên độ lớn nhất (xem Công thức E-1 của ISO/IEC 15444-1).

≥ max(Mb)                   (F-9)

Điều này đảm bảo rằng giá trị phân cp được sử dụng sẽ đủ lớn để đảm bảo rằng tất cả các bit có trọng s liên quan đến ROI sẽ nằm trong mặt phng bit cao hơn so với tất cả các bit có trọng số liên quan đến ảnh nền.

F.3.3  Mô tả phương pháp dựa trên Scaling (tham khảo)

Như đã đề cập trong phần giới thiệu của F.3, phần mô tả mã hóa ROI chỉ có tính chất tham khảo. Tuy nhiên, khi sử dụng phương pháp ROI dựa trên Scaling, sự thất bại trong việc tạo mặt nạ ROI chính xác  phía bộ mã hóa sẽ làm giảm đáng kể chất lượng ảnh được mã hóa và sẽ gây tổn thất khi giải mã. Xem F.4.2 về việc tạo mặt nạ ROI bằng phương pháp dựa trên Scaling.

Các hệ số biến đi được lượng tử sẽ được phân cấp theo cách thức sao cho trọng số tương đối của mỗi hệ số biến đi bằng với giá trị một phân cấp nhất định, s, của ROI mà chúng được áp dụng. Nếu một hệ số biến đổi lại thuộc một vài ROI thì giá trị s ln nhất sẽ được lựa chọn. Nếu một hệ số biến đổi thuộc ảnh nền thì giá trị phân cấp s bằng 0. Trước khi phân cấp các hệ số biến đổi được lượng tử hóa của một khối mã thì phải tìm giá trị phân cấp lớn nhất SMax và nhỏ nhất sMin đối với khối mã.

Xét hệ số biến đổi được lượng tử, q­b(u,v,w), trong khối mã hiện tại có giá trị phân cấp tương ứng, s, (với sMin < s ≤ sMax). Sau khi phân cấp, các bit riêng lẻ của qb(u,v,w) kết thúc abs(sMax – s) mặt phẳng bit thấp hơn các bit tương ứng của hệ số có s = sMax. Số lượng bit biên độ cho khối mã này do đó sẽ tăng thê(sMax  sMin).

Do các khối mã được xử lý độc lập nên các hệ số biến đi được lượng tử thuộc về cùng một ROI có thể kết thúc mà có các mức trọng số khác nhau trong các khối mã khác nhau. Sự chênh lệch này giữa các khối mã phải được cân nhắc bởi bộ phân bổ tốc độ. Một ví dụ về việc này là nếu toàn bộ một khối mã thuộc nh nền và một khối mã khác lại có cả các hệ số ROI và ảnh nền. Trong trường hợp này, các hệ số ảnh nền trong khối mã thứ hai phải được dịch lại s0 bước, còn trong khối mã thứ nhất không phải dịch. Khi đó, thuật toán phân bổ tốc độ sẽ quyết định việc đảm bảo rằng các mặt phẳng bit từ hai khối mã đều được đưa vào dòng bit theo thứ tự đúng.

Khi bộ mã hóa và giải mã entropy mã hóa các hệ số biến đổi được lượng tử thì các mặt phẳng bit liên quan đến ROI sẽ được mã hóa trước hoặc cùng thời điểm với thông tin liên quan đến ảnh nền. Giá trị phân cấp, sicho mỗi ROI được quy định bi người dùng hoặc ứng dụng.

Phương pháp này có th được mô tả bằng các bước sau cho tập gồm n ROI:

– Với mỗi khối mã trong mỗi thành phần:

1) Tạo mặt nạ ROI cho toàn bộ ROI i{Mi(u,v,w)}, xem F.4.2.

2) Tìm sMin and sMax, với sMin và sMax tương ứng là các giá trị phân cấp nhỏ nhất và lớn nhất trong khối mã hiện tại.

3) Cộng sBlock = sMax – sMin LSB vào mỗi hệ số |qb(u,v,w)|. Số lượng mặt phẳng bit biên độ Mb đối với băng b khi đó sẽ là:

Mb = Mb + sBlock                                                                                   (F-10)

với M­b được cho bởi Công thức E-2 của ISO/IEC 15444-1 và giá trị mới của mỗi hệ số sẽ được cho bởi:

                           (F-11)

4) Đối với mỗi hệ số trong từng khối mã, tìm giá trị phân cấp cao nhất và đặt s(u,v,w) thành:

s(u,v,w) = smax – max(si – Mi(u,v,w))                      (F-12)

với i = 0 … (s lượng ROI – 1).

5) Giảm dần tất cả các hệ số sao cho:

                          (F-13)

6) Đối với mỗi ROI, viết giá trị phân cấp s, kiểu, và các điểm tham chiếu vào dòng mã sử dụng đoạn nhãn RGN như được mô tả trong A.2.4.

F.4  Tạo mặt nạ vùng quan tâm

Để có được một ROI có chất lượng tốt hơn so với phần còn lại của ảnh mà vẫn duy trì được độ nén phù hợp thì các bít cần được tiết kiệm bằng cách gửi ít thông tin về ảnh nền. Để làm việc này thì mặt nạ ROI sẽ được tính toán. Mặt nạ này là một mặt phẳng bit chỉ ra một tập các hệ số biến đổi được lượng tử mà sự mã hóa chúng là đủ cho bộ thu phục dựng vùng mong muốn với cht lượng tốt hơn so với ảnh nền (gần như không tổn thất).

Để th hiện khái niệm về việc tạo mặt nạ ROI, xét một ROI đơn và một thành phần khối đơn, và xác định các mẫu thuộc ROI đó trong miền khối cho bởi mặt nạ nhị phân, M(x, y, z), với:

hệ số sóng con (x,y,z) được yêu cầu

(F-14)

độ chính xác trên (x,y,z) có thể thoải mãn mà không ảnh hưởng đến ROI

Mặt nạ là bản đồ của ROI trong miền sóng con sao cho chúng có giá trị khác 0 trong ROI và bằng 0 ngoài ROI. Trong mỗi bước, mỗi băng con của mặt nạ khi đó sẽ được cập nhật theo thứ tự quét mành. Mặt nạ khi đó sẽ chỉ ra các hệ số nào được yêu cầu tại bước này sao cho sự biến đổi nghịch sẽ cho lại các hệ số của mặt nạ trưc đó.

Ví dụ, bước cuối cùng của biến đổi nghịch là bước hợp nhất hai băng con thành một. Để đến được bước này thì phải tìm được các hệ số của cả hai băng con. Bước trước đó là bước hợp nhất bốn băng con thành hai băng. Để đến được bước này thì phải tìm được các hệ số trong bốn băng con cần để phục dựng các hệ số có trong mặt nạ của hai băng con đó một cách hoàn ho. Cũng như vậy, bước trước đó là bước hợp nhất tám băng con thành bốn băng con. Lại một lần nữa, để đến được bước này thì phải tìm được các hệ số trong tám băng con cần cho tất c bốn băng con này.

Tất cả các bước sau đó đều được thực hiện ngược lại để cho ra mặt nạ. Nếu các hệ số tương ứng với mặt nạ được phát đi và thu lại, và sự biến đổi nghịch đã được tính toán trên các hệ số này t ROI mong muốn sẽ được phục dựng vi chất lượng tốt hơn so với phần còn lại của khối (gần như không tổn thất nếu các hệ số ROI đều được mã hóa không tổn thất).

F.4.1  Tạo mặt nạ vùng quan tâm cho phương pháp Maxshift (tham khảo)

Phần dưới đây mô tả cách thức m rộng mặt nạ bằng các bộ lọc khác nhau. Các phương pháp tương tự có thể được sử dụng đối với các bộ lọc khác.

F.4.1.1  Tạo mặt nạ vùng quan tâm bằng bộ lọc thuận nghch 5-3 (tham khảo)

Để  được một tập tối ưu các tham số được lượng tử đ tiến hành phân cấp thì cần sử dụng các công thức đã được mô tả trong điều này.

Biến đi sóng con nghịch đã được sử dụng đ tìm ra các hệ số cần có trong mặt nạ. Công thức F-5 và F-6 của ISO/IEC 15444-1 cho các hệ số cần đ phục dựng X(2n) và X(2n + 1) mà không tn thất. Có thể thấy ngay rằng đó là L(n), L(n + 1), H(n – 1), H(n), H(n + 1) (xem Hình H.1 của ISO/IEC 15444-1). Do vậy, nếu X(2n) và X(2n + 1) nằm trong ROI thì các hệ số băng con thấp và cao  trên đều có trong mặt nạ. Lưu ý rằng X(2n) và X(2n +1) tương ứng là các đim có chỉ số chẵn và l, liên quan đến gốc lưới tọa độ tham chiếu.

F.4.1.2  Tạo mặt nạ vùng quan tâm bằng bộ lọc không thuận nghịch 9-7 (tham khảo)

Sự giải mã thành công không phụ thuộc vào việc lựa chọn các mẫu để tiến hành phân cấp. Để có được tập tối ưu các hệ số được lượng tử để tiến hành phân cấp thì cần sử dụng các công thức đã được mô tả trong điều này.

Để tìm được các hệ số cần có trong mặt nạ thì biến đổi sóng con nghịch đã được sử dụng như trong H.3.1.1 của ISO/IEC 15444-1. Điều này đã được mô tả trong Hình H.2. X(2n) và X(2n + 1) tương ứng là các điểm có chỉ s chẵn và lẻ, liên quan đến gc lưới tọa độ tham chiếu.

Có thể thấy ngay rằng, các hệ số cần để phục dựng X(2n) và X(2n + 1) mà không tổn thất là L(n  1) đến L(n + 2) và H(n – 2) đến H(n + 2). Do đó, nếu X(2n) và X(2n + 1) đều nằm trong ROI thì các hệ s băng con thp và cao này đều nằm trong mặt nạ.

F.4.2  Tạo mặt nạ vùng quan tâm bằng phương pháp dựa trên Scaling

Dưới đây là những mô tả về cách thức m rộng mặt nạ cho trường hợp hình khối và hình Elipxoit và cách thức thực hiện với các bộ lọc khác nhau. Các phương pháp tương tự có thể được sử dụng đối với các bộ lọc khác.

F.4.2.1  Tạo mặt nạ hình khối trên lưới tọa độ tham chiếu

Mặt nạ hình khối được mô tả trong điều này được tạo trên lưới tọa độ tham chiếu. Khi được tạo trên lưới tọa độ tham chiếu, phương pháp được mô tả trong F.4.2.3 được sử dụng để tạo mặt nạ trong miền sóng con. Một hình khối được mô tả bi sáu tham số, xem Hình F.1, tt cả đều được báo hiệu trong nhãn RGN (xem A.2.4). Các tham số gồm (XArgn, YArgn, ZArgn, XBrgn, YBrgn, ZBrgn), với XArgn, YArgn và ZArgn là độ lệch x, y và z của góc trên bên trái mặt trước của hình khối từ gốc lưới tọa độ tham chiếu, trong đó XBrgn, YBrgn và ZBrgn tương ứng là chiều rộng, chiều cao và chiều sâu của hình khối.

Mặt nạ đúng của lưới tọa độ tham chiếu được cho bởi Công thức F-15.

XArgn ≤ x ≤ XArgn + XBrgn

YArgn ≤ y ≤ YArgn + YBrgn

ZArgn ≤ z ≤ ZArgn + ZBrgn

(F-15)

Hình F.1 – Mặt nạ hình khối trên lưới tọa độ tham chiếu

F.4.2.2  Tạo mặt nạ Elipxoit trên lưới tọa độ tham chiếu

Mặt nạ Elipxoit mô tả trong phần này được tạo trên lưới tọa độ tham chiếu. Khi được tạo trên lưới tọa độ tham chiếu, phương pháp được mô tả trong F.4.2.3 được sử dụng để tạo mặt nạ trong miền sóng con. Hình Elipxoit được mô tả bởi sáu tham số, xem Hình F.2, tất cả các tham số đều được báo hiệu trong nhãn RGN (xem A.2.4). Các tham số gồm (XArgn, YArgn, ZArgn, XBrgn, YBrgn, ZBrgn), vớXArgn, YArgn và ZArgn là độ lệch xy và z của tâm hình Elipxoit từ gốc lưới tọa độ tham chiếu, trong đó XBrgn, YBrgn và ZBrgn tương ứng là chiều rộng, chiều cao và chiều sâu của hình Elipxoit.

Mặt nạ đúng của lưới tọa độ tham chiếu được cho bởi Công thức F-16.

                    (F-16)

Hình F.2 – Mặt nạ Elipxoit trên lưới toạn độ tham chiếu

F.4.2.3  Tạo nhanh mặt nạ hình khối (tham khảo)

Trong trường hợp ROI hình khối thì mặt nạ có thể được tạo nhanh hơn so với các kiểu nhị phân. Trong trường hợp này, thay vì phải tìm ra cách thức phục dựng từng hệ số và giá trị voxel theo biến đi nghịch thì chỉ cần xem xét hai vị trí, đó là góc trên bên trái mặt trước và góc dưới bên phải mặt sau của mặt nạ. Góc trước bên trái cao nhất (x1,y1,z1) trên lưi tọa độ tham chiếu sẽ được cho trong đoạn nhãn RGN là (XArgn, YArgn, ZArgn), trong đó góc sau bên phải thp nhất (x2,y2,z2) trên lưới tọa độ tham chiếu sẽ được cho bi các tham số trong đoạn nhãn RGN là (XArgn + XBrgn – 1), (YArgn + YBrgn – 1), (ZArgn + ZBrgn – 1).

Việc tạo mặt nạ cũng phải xem xét xem loại bộ lọc nào đã được sử dụng cho biến đổi.

Trong mỗi mức phân tách, các bước được mô tả  phần trước được thực hiện để xem mặt nạ được mở rộng như thế nào. Xét một mặt nạ 1D cần được phân tách, Rext, và đặt x1 và x2 là các chỉ số thp nhất và cao nhất của các mẫu khác 0 trong Rext.

1) Với mỗi bước nâng s với s trong dải từ 0 đến NLS – 1:

i) Tìm chỉ số mẫu thấp nhất (2n +ms  x1) nằm trong mt nạ

                                                (F-17)

nếu (x1 > x1) thì x1 = x1                                                                                                 (F-18)

ii) Tìm chỉ số mẫu cao nhất (2n + ms ≤ x2)

                                (F-19)

nếu (x2 > x2) thì x2 = x2                                              (F-20)

iii) Đặt x1 = x1, x= x’2 với ms = 1 – ms-1 chỉ ra rằng bước nâng thứ s áp dụng cho các hệ số có chỉ số chẵn (ms = 0) hay cho các hệ số có chỉ s lẻ (ms = 1), và với Ls là số lượng hệ số nâng cho bước nâng s.

Đặt tất cả các mẫu giữa x1 và x2, kể cả tại x1 và x2, là khác 0 và sau đó sử dụng thủ tục giải chèn được mô tả trong F.4.5 của ISO/IEC 15444-1 để phân chia các mẫu mặt nạ ROI thành các băng con theo cách các hệ số sóng con được phân chia.

F.5  Các lưu ý về mã hóa vùng quan tâm

F.5.1  Cách sử dụng các phương pháp Scaling và Maxshift

Không được sử dụng phương pháp Maxshift cùng với phương pháp dựa trên Scaling và ngược lại.

F.5.2  Lưu ý về đa thành phần (tham khảo)

Đối với trường hợp các ảnh màu thì áp dụng phương pháp này riêng cho từng thành phần màu. Nếu một vài thành phần màu bị gim kích thưc thì mặt nạ cho các thành phần giảm kích thước sẽ được thiết lập theo như cách với mặt nạ của các thành phần không b giảm kích thước.

F.5.3  Lưu ý về độ chính xác trong triển khai (tham kho)

Trong một vài trường hợp, phương pháp mã hóa ROI này có thể làm vượt quá dải động. Tuy nhiên, vấn đề này dễ dàng được giải quyết bằng cách đơn giản là loại b bớt các mặt phẳng bit có ý nghĩa thấp nhất hiện đang vượt quá giới hạn do quá trình giảm kích thước. Tác động của việc này sẽ làm ROI có chất lượng tốt hơn so với ảnh nền, cho dù là toàn bộ dòng bit đã được giải mã. Tuy nhiên, điều này có thể lại gây nên các vấn đề nếu ảnh được mã hóa với ROI theo kiểu không tổn thất. Việc loại bỏ các mặt phẳng bit có ý nghĩa thấp nhất đối vi ảnh nền có th lại làm cho ảnh nền không được mã hóa không tn thất, và trường hợp tồi nhất là ảnh nền có thể không hề được phục dựng. Điều này sẽ tùy thuộc vào dải động.

 

Phụ lục G

(Tham khảo)

Các ví dụ và hướng dẫn, phần mở rộng

G.1  Mô hình hóa tc độ méo

Xem J.14 của ISO/IEC 15444-1.

 

Thư mục tài liệu tham khảo

[1] Morton, G.M. (1966), A Computer Oriented Geodetic Data Base and a New Technique in File Sequencing, IBM Ltd, Ottawa, Canada.

[2] Taubman, D., Marcellin, M.W. (2001), JPEG2000- Image Compression: Fundamentals, Standards and Practice, Hingham, MA: Kluwer Academic Publishers.

[3] Schelkens, P. (2001), Multidimensional wavelet coding- algorithms and implementations, PhD Thesis, Department of Electronics and Information Processing (ETRO), Vrije Universiteit Brussel, Brussel.

[4] Schelkens, P., Munteanu, A., Barbarien, J., Galca, M., Giro i Nieto, X., and Cornelis, J. (2003), Wavelet Coding of Volumetric Medical Datasets, IEEE Transactions on Medical Imaging, Vol. 22, pp. 441-458.

[5] Schelkens, P., Skodras, A., Ebrahimi, T., et al. (2009), The JPEG 2000 Suite, John Wiley & Sons, Ltd.

   
   

 

MỤC LỤC

 Phạm vi áp dụng

2  Tài liệu viện dẫn

3  Thuật ngữ và định nghĩa

4  Thuật ngữ viết tắt

5  Ký hiệu (và thuật ngữ viết tắt)

6  Mô tả chung

Phụ lục A (Quy định) Cú pháp dòng mã, phần m rộng

Phụ lục B (Quy định) Ảnh và xếp thứ tự dữ liệu ảnh nén, phần m rộng

Phụ lục C (Quy định) Mô hình hóa bit hệ số

Phụ lục D (Quy đnh) Biến đổi sóng con rời rạc của các khối ảnh – thành phần

Phụ lục E (Quy định) Lượng tử hóa

Phụ lục F (Quy định) Mã hóa ảnh theo vùng quan tâm, phần mở rộng

Phụ lục G (Tham khảo) Các ví dụ và hướng dẫn, phần m rộng

Thư mục tài liệu tham khảo

TIÊU CHUẨN QUỐC GIA TCVN 11777-10:2017 (ISO/IEC 15444-10:2011) VỀ CÔNG NGHỆ THÔNG TIN – HỆ THỐNG MÃ HÓA HÌNH ẢNH JPEG 2000 – PHẦN MỞ RỘNG ĐỐI VỚI DỮ LIỆU BA CHIỀU
Số, ký hiệu văn bản TCVN11777-10:2017 Ngày hiệu lực
Loại văn bản Tiêu chuẩn Việt Nam Ngày đăng công báo
Lĩnh vực Giao dịch điện tử
Ngày ban hành 01/01/2017
Cơ quan ban hành Tình trạng Còn hiệu lực

Các văn bản liên kết

Văn bản được hướng dẫn Văn bản hướng dẫn
Văn bản được hợp nhất Văn bản hợp nhất
Văn bản bị sửa đổi, bổ sung Văn bản sửa đổi, bổ sung
Văn bản bị đính chính Văn bản đính chính
Văn bản bị thay thế Văn bản thay thế
Văn bản được dẫn chiếu Văn bản căn cứ

Tải văn bản