TIÊU CHUẨN QUỐC GIA TCVN 11777-2:2018 (ISO/IEC 15444-2:2004 WITH AMENDMENT 2:2006, 3:2015, 4:2015) VỀ CÔNG NGHỆ THÔNG TIN – HỆ THỐNG MÃ HÓA ẢNH JPEG 2000 – PHẦN MỞ RỘNG
TCVN 11777-2:2018
ISO/IEC 15444-2:2004
WITH AMENDMENT 2:2006
WITH AMENDMENT 3:2015
WITH AMENDMENT 4:2015
CÔNG NGHỆ THÔNG TIN – HỆ THỐNG MÃ HÓA ẢNH JPEG 2000 – PHẦN MỞ RỘNG
Information technology – JPEG 2000 image coding system – Extensions
Mục lục
1 Phạm vi áp dụng
2 Tài liệu viện dẫn
3 Thuật ngữ và định nghĩa
3.1 Định nghĩa
3.2 Các từ viết tắt và ký hiệu
4 Mô tả chung
4.1 Phần mở rộng đặc tả bởi tiêu chuẩn
4.2 Quan hệ giữa các phần mở rộng
Phụ lục A (Quy định) Cú pháp nén dữ liệu, phần mở rộng
A.1 Khả năng mở rộng
A.2 Mở rộng đối với các tham số đánh dấu phân đoại của ITU-T Rec. T.800 | ISO/IEC 15444-1
A.3 Các đoạn nhãn mở rộng
Phụ lục B (Quy định) Độ lệch DC biến thiên, phần mở rộng
B.1 Luồng độ lệch DC biến thiên
B.2 Độ lệch DC ngược
B.3 Độ lệch DC hướng thuận (thông tin)
Phụ lục C (Quy định) Lượng tử hóa vô hướng biến thiên, phần mở rộng
C.1 Lượng tử hóa vô hướng biến thiên
C.2 Phục hồi lượng tử hóa vô hướng biến thiên đối với các bộ lọc không thuận nghịch
C.3 Lượng tử hóa vô hướng biến thiên đối với các bộ lọc không thuận nghịch (thông tin)
Phụ lục D (Quy định) Mở rộng lượng tử hóa mã lưới
D.1 Giới thiệu về lượng tử hóa mã lưới (TCQ)
D.2 Định nghĩa tuần tự
D.3 Lượng tử hóa TCQ hướng thuận (thông tin)
D.4 Lượng tử hóa hướng ngược chính tắc)
D.5 Quá trình phân bổ tỷ lệ Lơgrăng (thông tin)
Phụ lục E (Quy định) Hình ảnh che, phần mở rộng
E.1 Giới thiệu về mặt nạ thị giác (thông tin)
E.2 Mở rộng từng điểm phi tuyến (thông tin)
E.3 Giải mã có mặt nạ thị giác
E.4 Mã hóa có mặt nạ thị giác (thông tin)
E.5 Các tham số cài đặt (thông tin)
Phụ lục F (Quy định) Phân tách tùy ý của thành phần khối ảnh, phần mở rộng
F.1 Băng con sóng con
F.2 Phương trình, văn bản và cập nhật phân tách
F.3 Biến đổi sóng con rời rạc ngược cho phân tách chung
F.4 Biến đổi sóng con rời rạc hướng thuận cho phân tách chung (thông tin)
Phụ lục G (Quy định) Biến đổi ảnh đối xứng mẫu đầy đủ, phần mở rộng
G.1 Các tham số, định nghĩa và chuẩn hóa biến đổi sóng con
G.2 Phục dựng biến đổi sóng con đối xứng mẫu đầy đủ
G.3 Phân tách biến đổi sóng con đối xứng mẫu đầy đủ (thông tin)
G.4 Ví dụ về biến đổi sóng con WS (thông tin)
Phụ lục H (Quy định) Biến đổi ảnh sử dụng phép biến đổi sóng con tùy ý
H.1 Các tham số và chuẩn hóa biến đổi sóng con
H.2 Thủ tục phục dựng biến đổi sóng con tùy ý (ARB)
H.3 Thủ tục phân tách biến đổi sóng con tùy ý (ARB) (thông tin)
H.4 Ví dụ biến đổi sóng con ARB (thông tin)
Phụ lục I (Quy định) Biến đổi sóng con rời rạc chồng lấn mẫu riêng biệt, phần mở rộng
I.1 Giới thiệu chồng lấn mẫu đơn
1.2 Điểm định vị khối mã (CBAP) mở rộng
1.3 Mở rộng SSO
1.4 Phần mở rộng TSSO
1.5 Kết hợp các phần mở rộng SSO và TSSO (thông tin)
Phụ lục J (Quy định) Biến đổi nhiều thành phần, phần mở rộng
J.1 Giới thiệu khái niệm biến đổi nhiều thành phần
J.2 Tổng quan về xử lý thuận nghịch
J.3 Biến đổi
Phụ lục K (Quy định) Biến đổi phi tuyến
K.1 Báo hiệu sử dụng biến đổi phi tuyến
K.2 Các đặc tính biến đổi phi tuyến
Phụ lục L (Quy định) Miền quan tâm mã hóa và rút trích, phần mở rộng
L.1 Giải mã ROI
L.2 Mô tả phương pháp tỷ lệ
L.3 Tạo mặt nạ miền quan tâm
L.4 Diễn giải mã hóa miền quan tâm
Phụ lục M (Quy định) Cú pháp định dạng tập tin mở rộng JPX
M.1 Phạm vi định dạng tập tin
M.2 Giới thiệu về JPX
M.3 Thang màu xám / màu/ bảng màu/ kiến trúc đặc tính nhiều thành phần
M.4 phân mảnh dòng mã giữa một hoặc nhiều tập tin hơn
M.5 Kết hợp nhiều dòng mã
M.6 Sử dụng các yêu cầu kết xuất che giấu để xác định cách sử dụng một tập tin
M.7 Mở rộng với định dạng tập tin JPX và đăng ký các phần mở rộng
M.8 Sự khác biệt từ định nghĩa nhị phân JP2
M.9 Sự phù hợp
M.10 Khóa mô tả đồ họa (thông tin)
M.11 Các hướng ngược đã xác định
M.12 Xử lý với hướng ngược chưa biết
M.13 Sử dụng các định dạng tập tin JPX kết hợp với các tiêu chuẩn đa phương tiện khác (thông tin)
Phụ lục N (Quy định) Định nghĩa và cú pháp siêu dữ liệu mở rộng định dạng tập tin JPX
N.1 Giới thiệu siêu dữ liệu mở rộng
N.2 Các tham chiếu bổ sung cho siêu dữ liệu mở rộng
N.3 Phạm vi định nghĩa siêu dữ liệu
N.4 Cú pháp siêu dữ liệu
N.5 Các hướng ngược đã xác định
N.6 Các định nghĩa siêu dữ liệu
N.7 Dạng cơ bản và định nghĩa phần tử
N.7.2 Các thuộc tính được định nghĩa
N.8 Định nghĩa dạng tài liệu siêu dữ liệu mở rộng JPX
N.9 Sơ đồ XML siêu dữ liệu mở rộng JPX
Phụ lục O (Tham khảo) Các ví dụ và hướng dẫn, phần mở rộng
O.1 Các ví dụ phân tách tùy ý
O.2 Quy ước khối ảnh lẻ thông thấp đầu tiên (OTLPF)
O.3 Ví dụ tập hợp nhiều thành phần
O.4 Nền tảng nâng cao lượng tử hóa
Thư mục tài liệu tham khảo
Lời nói đầu
TCVN 11777-2:2018 hoàn toàn tương đương với tiêu chuẩn ISO/IEC 15444-2:2004 (và with amendment 2:2006, with amendment 3:2015, with amendment 4:2015).
TCVN 11777-2:2018 do Học viện Công nghệ Bưu chính Viễn thông biên soạn, Bộ Thông tin và Truyền thông đề nghị, Tổng cục Tiêu chuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ công bố.
CÔNG NGHỆ THÔNG TIN – HỆ THỐNG MÃ HÓA ẢNH JPEG 2000 – PHẦN MỞ RỘNG
Information technology – JPEG 2000 image coding system – Extensions
1 Phạm vi áp dụng
Tiêu chuẩn này đưa ra các phương pháp nén không tổn thất (bảo toàn bit) và nén có tổn thất để mã hóa các ảnh màu số có sắc độ liên tục, hai mức, theo thang màu xám, ảnh màu số tĩnh hoặc các ảnh nhiều thành phần.
Tiêu chuẩn này:
– Đặc tả quá trình giải mã mở rộng để biến đổi dữ liệu ảnh nén thành dữ liệu ảnh phục dựng.
– Đặc tả cú pháp dòng mã mở rộng chứa thông tin để biên dịch dữ liệu ảnh nén.
– Đặc tả định dạng tệp tin mở rộng.
– Đặc tả đóng gói để lưu trữ siêu dữ liệu ảnh.
– Quy định bộ tiêu chuẩn cho siêu dữ liệu ảnh.
– Hướng dẫn quá trình mã hóa mở rộng để biến đổi dữ liệu ảnh gốc thành dữ liệu ảnh nén.
– Hướng dẫn cách thực hiện các quá trình này trên thực tế.
2 Tài liệu viện dẫn
Tài liệu viện dẫn sau rất cần thiết cho việc áp dụng tiêu chuẩn này. Đối với các tài liệu viện dẫn ghi năm công bố thì áp dụng phiên bản được nêu. Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất, bao gồm cả sửa đổi, bổ sung (nếu có).
ISO/IEC 15444-2 : 2004 – Information Technology – JPEG 2000 Image Coding System: Extensions (Công nghệ thông tin – Hệ thống mã hóa ảnh JPEG 2000 – Phần mở rộng).
WITH AMENDMENT 2:2006.
WITH AMENDMENT 3:2015.
WITH AMENDMENT 4:2015.
3 Thuật ngữ và định nghĩa
3.1 Định nghĩa
3.1.1
Thuộc tính (attribute)
Cấu trúc XML là sự mở rộng cặp giá trị – tên hoặc mô tả tính chất của phần tử.
3.1.2
Tế bào (cell)
Phân chia khối ảnh tùy chọn sử dụng cho mã hóa và giải mã bộ nhớ thấp.
3.1.3
Thành phần (component)
Dữ liệu nén từ dòng mã đại diện cho bộ dữ liệu hai chiều đơn.
3.1.4
Tập hợp thành phần (component collection)
Một tập con của các thành phần trung gian được sử dụng như là đầu vào giai đoạn biến đổi nhiều thành phần và một tập con của các thành phần trung gian nhận được như là đầu ra của giai đoạn biến đổi nhiều thành phần. Các thành phần hợp thành của tập con có thể thực hiện theo thứ tự tùy ý, nghĩa là, hoán đổi mối quan hệ theo thứ tự xuất hiện của chúng trong tập hợp đầu vào hoặc đầu ra các thành phần trung gian.
3.1.5
Ma trận phục dựng thành phần (component reconstruction arrays)
Một thuật ngữ chung có liên quan tới bất kỳ những điều sau đây: ma trận biến đổi không tương quan, ma trận biến đổi phụ thuộc hoặc ma trận độ lệch.
3.1.6
Hợp thành (hợp lại)
Hoạt động kết hợp hai lớp thành phần thành một lớp đơn lẻ, tập các kênh ảnh (không dự phòng).
3.1.7
Lớp hợp thành (hợp lại layer)
Một tập các kênh không dự phòng tách ra từ một hoặc nhiều dòng mã, điều này được xem như một nhóm. Tập các lớp hợp thành trong tập tin JPX có thể được kết hợp nhờ hợp thành hoặc các hướng dẫn hoạt hình tạo ra một kết quả kết xuất. Ví dụ, một lớp có thể là một dòng mã RGBA đơn. Lớp khác có thể bao gồm các kênh R, G, B được tạo nên nhờ ghép bảng màu thành một thành phần từ dòng mã 1 và một kênh trắng đen được tách ra trực tiếp từ dòng mã 2.
3.1.8
Vùng chết (Deadzone)
Khoảng thời gian trong đó tất cả các hệ số băng con được lượng tử hóa là 0.
3.1.9
Mức phân tách (decomposition level)
Một tập các băng con ở mỗi hệ số có cùng tác động không gian hoặc mở rộng trong mối liên quan với mẫu gốc. Điều này bao gồm băng con tách ra của các mức phân tách phụ LL, LH, HL, HH, LX, HX, XL và XH.
3.1.10
Mức phụ phân tách (decomposition sub-level)
Một tập các băng con do chia tách của một băng con từ mức phụ phân tách thấp hơn hoặc do chia tách của các băng con hoặc LL, LX hoặc XL từ một mức phân tách cao hơn.
3.1.11
Ma trận biến đổi không tương quan (decorrelation transformation array)
Một ma trận các hệ số ở đó ánh xạ các thành phần đầu vào của một tập hợp thành phần tới các thành phần đầu ra của tập hợp qua phép biến đổi không tương quan nhiều thành phần.
3.1.12
Ma trận biến đổi phụ thuộc (dependency transformation array)
Một ma trận các hệ số ở đó ánh xạ các thành phần đầu vào của một tập hợp thành phần tới các thành phần đầu ra của tập hợp qua phép biến đổi phụ thuộc quan nhiều thành phần.
3.1.13
Phần tử (thành phần)
Một đánh dấu mở rộng (XML) cấu tạo gồm cờ bắt đầu và cờ kết thúc với dữ liệu được đóng gói bên trong.
3.1.14
Băng con HX (HX sub-band)
Băng con thu được nhờ lọc phân tích thông cao phương ngang hướng thuận và không lọc phân tích phương dọc. Băng con này góp phần vào quá trình phục dựng bằng lọc tổng hợp thông cao phương ngang hướng ngược và không lọc tổng hợp phương dọc.
3.1.15
Thành phần trung gian (intermediate component)
Một ma trận dữ liệu hai chiều đơn lẻ tham gia vào tầng biến đổi nhiều thành phần.
3.1.16
Đường cơ sở JPX (JPX baseline)
Tập hợp con cụ thể các đặc trưng của định dạng tệp JPX.
3.1.17
Bộ đọc đường cơ sở JPX (JPX baseline reader)
Một ứng dụng diễn dịch đúng tất cả các tệp tin phù hợp với định nghĩa trong tập tin đường cơ sở JPX.
3.1.18
Tệp tin JPX (JPX file)
Tên của tệp tin trong định dạng tệp được mô tả trong tiêu chuẩn này. Về cấu trúc thì tệp JPX là các chuỗi các hướng ngược liên tiếp nhau.
3.1.19
Băng con LX (LX sub-band)
Băng con thu được nhờ lọc phân tích thông thấp phương ngang hướng thuận và không lọc phân tích phương dọc. Băng con này góp phần vào quá trình phục dựng bằng lọc tổng hợp thông thấp phương ngang hướng ngược và không lọc tổng hợp phương dọc.
3.1.20
Siêu dữ liệu (metadata)
Dữ liệu bổ sung gắn kèm với dữ liệu ảnh, ngoài phạm vi dữ liệu ảnh thành dữ liệu ảnh lớn hơn.
3.1.21
Vùng tên (namespace)
Tập hợp của các tên được nhận dạng bởi định danh tài nguyên thống nhất (URI), điều đó cho phép tài liệu XML của các nguồn khác nhau sử dụng chung tên phần tử trong một tài liệu riêng biệt để tránh xung đột tên phần tử.
3.1.22
Ma trận độ lệch (offset array)
Một ma trận các hệ số bao hàm các độ lệch được bổ sung vào các thành phần trung gian trong quá trình biến đổi nhiều thành phần của một tập hợp thành phần.
3.1.23
Thành phần ảnh phục dựng (reconstructed image component)
Tập hợp các thành phần trung gian đầu ra từ tầng biến đổi cuối cùng trong quá trình biến đổi nhiều thành phần ngược.
3.1.24
Kết quả kết xuất (rendered result)
Kết quả được tạo ra nhờ kết hợp các lớp hợp thành trong tệp JPX, hoặc nhờ ghép hợp hoặc nhờ ảnh động.
3.1.25
Độ phân giải (resolution)
Quan hệ về không gian của các mẫu về khoảng cách vật lý. Trong tiêu chuẩn này, các mức phân tách của biến đổi sóng con tạo ra các phân giải phân biệt bởi công suất của hai trong hoặc chỉ phương ngang, phương dọc hoặc cả hai phương ngang và dọc. Mức phân tách cuối cùng (cao nhất) bao gồm hoặc băng con LL, LX hoặc băng con XL được xem như là phân giải thấp hơn. Vì thế, sẽ có thêm một mức phân giải so với các mức phân tách.
3.1.26
Băng con (sub-band)
Một nhóm các hệ số biến đổi do chuỗi hoạt động lọc băng cao và băng thấp, hoặc chỉ phương ngang, phương dọc hoặc cả hai phương ngang và dọc.
3.1.27
Thành phần phục dựng không gian (spatially reconstructed component)
Một thành phần được tách ra từ dòng mã và thông qua giải mã cũng như quá trình biến đổi sóng con ngược như đặc tả trong tiêu chuẩn này. Tập hợp các thành phần phục dựng về không gian là tập hợp của các thành phần đầu vào tới tầng biến đổi đầu tiên trong quá trình biến đổi nhiều thành phần.
3.1.28
Giai đoạn biến đổi (transformation stage)
Một tập các tập hợp thành phần và được kết hợp với các biến đổi nhiều thành phần.
3.1.29
Mặt nạ thị giác (visual masking)
Là một cơ chế che vật thể bằng hình ảnh thể hiện dưới dạng tín hiệu nền.
3.1.30
Băng con XH (XH sub-band)
Băng con nhận được nhờ không lọc phân tích phương ngang hướng thuận và lọc phân tích thông cao phương dọc. Băng con này góp phần vào quá trình phục dựng bằng lọc tổng hợp thông cao phương dọc và không lọc tổng hợp phương ngang hướng ngược.
3.1.31
Băng con XL (XL sub-band)
Băng con nhận được nhờ không lọc phân tích phương ngang hướng thuận và lọc phân tích thông thấp phương dọc. Băng con này góp phần vào quá trình phục dựng bằng lọc tổng hợp thông thấp phương dọc và không lọc tổng hợp phương ngang hướng ngược.
3.2 Chữ viết tắt và ký hiệu
3.2.1 Chữ viết tắt
Với mục đích của tiêu chuẩn này, áp dụng các từ viết tắt như sau theo định nghĩa của ITU-T Rec. T.800 và ISO-IEC 15444-1:
CCITT | International Telegraph and Telephone Consultative Committee | Ủy ban Tư vấn quốc tế về Điện thoại và Điện báo |
DPI | Dots per inch | Các điểm trên mỗi inch |
IPR | Intellectual Property Rights | Quyền sở hữu trí tuệ |
UUID | Universal Unique IDentifier | Định danh duy nhất toàn cục |
3.2.2 Các ký hiệu
Với mục đích của tiêu chuẩn này, áp dụng các ký hiệu như sau theo định nghĩa của ITU-T Rec. T.800 và ISO-IEC 15444-1:
ADS | Arbitrary decomposition styles marker | Nhãn loại phân tách tùy ý |
ATK | Arbitrary transformation kernels marker | Nhãn nhân biến đổi tùy ý |
CBD | Component bit depth definition marker | Nhãn xác định độ sâu bit thành phần |
DCO | Variable DC offset marker | Nhãn độ lệch DC biến đổi |
DFS | Downsample factor styles marker | Nhãn kiểu hệ số giảm mẫu |
ICT | Irreversible Colour transformation | Biến đổi màu không khả đảo |
ISO | International Organization for standardization | Tổ chức tiêu chuẩn hóa quốc tế |
ITU-T | International Telecommunication Union – Telecommunication standardization Sector | Liên minh viễn thông quốc tế – Bộ phận tiêu chuẩn hóa viễn thông |
LUT | Look-Up Table | Bảng tìm kiếm |
MCC | Multiple component collection transformation marker | Nhãn biến đổi tập hợp nhiều thành phần |
MCO | Multiple component transformation ordering marker | Nhãn trật tự biến đổi nhiều thành phần |
MCT | Multiple component transformation definition marker | Nhãn xác định biến đổi nhiều thành phần |
NLT | Non-linearity point transformation marker | Nhãn biến đổi điểm phi tuyến |
RCT | Reversible Colour Transformation | Biến đổi màu khả đảo |
RGN | Region of Interest Marker | Nhãn miền quan tâm |
SOT | Start of Tile-Part | Bắt đầu phần khối ảnh |
SSO | Single Sample Overlap | Chồng lấn mẫu đơn |
TCQ | Trelis Coded Quantization | Lượng tử hóa mã lưới |
TSSO | Tile Single Sample Overlap | Chồng lẫn mẫu khối ảnh đơn |
VDCO | Variable DC offset | Độ lệch DC biến thiên |
VMS | Visual Masking Marker | Nhãn mặt nạ thị giác |
VSQ | Variable scalar quantization | Lượng tử hóa vô hướng biến thiên |
4 Mô tả chung
Mục đích của điều này là đưa ra một cách nhìn khái quát về tiêu chuẩn. Các thuật ngữ định nghĩa trong điều trước trong tiêu chuẩn cũng sẽ được đưa vào (các thuật ngữ xác định trong điều 3 và 4 của ITU-T Rec.T.800 | ISO/IEC 15444-1 vẫn tiếp tục áp dụng trong tiêu chuẩn này).
Tiêu chuẩn này xác định tập hợp các phương pháp nén có tổn hao và không tổn hao (bảo toàn bít) đối với mã hóa ảnh tĩnh tông màu liên tục, hai mức, thang mức xám, ảnh tĩnh số màu hoặc ảnh nhiều thành phần. Tập hợp các phương pháp này mở rộng với các phần tử trong hệ mã hóa lõi được mô tả trong ITU-T Rec. T.800 | ISO/IEC 15444-1. Sự mở rộng gắn liền với mã hóa và giải mã được xác định như những thủ tục có thể sử dụng kết hợp với các quá trình mã hóa và giải mã mô tả trong ITU-T Rec. T.800 | ISO/IEC 15444-1. Mỗi sự mở rộng mã hóa hoặc giải mã sẽ chỉ được sử dụng kết hợp với các quá trình mã hóa riêng và cũng chỉ phù hợp với các yêu cầu thiết lập có hiệu lực trong tài liệu này. Những mở rộng này tương thích ngược theo hướng các bộ giải mã thực hiện những mở rộng này cũng sẽ hỗ trợ cấu hình các tập con, hiện được xác định bởi các tiêu chuẩn ITU-T Rec. T.800 | ISO/IEC 15444-1. Các tiêu chuẩn này cũng xác định mở rộng với định dạng dữ liệu nén, nghĩa là định dạng trao đổi và định dạng rút gọn.
4.1 Phần mở rộng đặc tả bởi tiêu chuẩn
Những mở rộng sau được đặc tả trong tiêu chuẩn.
4.1.1 Cú pháp
Một phần mở rộng của cú pháp dòng mã được mô tả trong Phụ lục A. Phần mở rộng này cung cấp tất cả các báo hiệu dòng mã trong tiêu chuẩn này. Hơn nữa, nó cũng dự tính trước báo hiệu cần thiết cho các đặc tính kỹ thuật về sau bao hàm trong tiêu chuẩn như một tham chiếu chuẩn. Thêm nữa, với cú pháp dòng mã được xác định trong ITU-T Rec. T.800 | ISO/IEC 15444-1, các khả năng sẽ được hỗ trợ: Độ lệch DC biến thiên, lượng tử hóa vô hướng biến thiên, lượng tử hóa mã lưới, hình ảnh che, phân tách tùy ý, lõi biến đổi tùy ý, chồng lấn mẫu đơn lẻ, biến đổi nhiều thành phần, biến đổi phi tuyến, miền quan tâm tùy ý. Các nhãn đã mở rộng này tuân theo quy luật chung giống như cú pháp trong ITU-T Rec. T.800 | ISO/IEC 15444-1.
4.1.2 Độ lệch DC biến thiên
Một phần mở rộng cung cấp độ lệch DC tùy ý được mô tả trong Phụ lục B. Độ lệch DC biến thiên có thể sử dụng để tạo nên phân bố dữ liệu tốt hơn cho đầu vào với biến đổi nhiều thành phần (RCT) và biến đổi màu không khả đảo (ICT) được xác định trong ITU-T Rec. T.800 | ISO/IEC 15444-1 và/hoặc biến đổi sóng con. Ảnh có phân bố mẫu rất lệch có thể được lợi nhờ độ lệch DC không mặc định.
4.1.3 Lượng tử hóa vô hướng biến thiên
Một phần mở rộng cung cấp lượng tử hóa vô hướng biến thiên được mô tả trong Phụ lục C. Mở rộng này cho phép miền không đổi nhỏ hơn hoặc lớn hơn sẽ được sử dụng với lượng tử hóa vô hướng. Kỹ thuật này có thể cải thiện dạng nhìn thấy của nguyên bản mức thấp.
4.1.4 Lượng tử hóa mã lưới
Một phần mở rộng của lượng tử hóa được mô tả trong Phụ lục D. Phần mở rộng này cung cấp lượng tử hóa mã lưới (TCQ). Thuật toán TCQ áp dụng lượng tử hóa vô hướng biến thiên không gian với chuỗi đầu vào của nó nhờ lựa chọn một trong bốn mẫu lượng tử hóa vô hướng. Lượng tử hóa biểu thị tập lớn của các lượng tử hóa này cùng với các dịch chuyển lượng tử hóa theo dạng lưới quy định tất cả các thông tin cần thiết để phục dựng các hệ số sóng con đã mã hóa TCQ.
4.1.5 Mặt nạ thị giác
Một phần mở rộng cung cấp mặt nạ thị giác được mô tả trong Phụ lục E. Mặt nạ thị giác là một kỹ xảo giả tạo được che chắn bởi ảnh hành động như là một tín hiệu nền. Mục đích chính là để cải thiện chất lượng ảnh, đặc biệt là sự hiển thị. Tác động thứ nhất của kỹ thuật này là để cải thiện chất lượng ảnh, trong đó mà sự cải thiện trở nên lớn hơn vì ảnh trở nên phức tạp hơn. Tác động chính thứ hai của kỹ thuật này là với tốc độ bit cố định đã cho, chất lượng ảnh ổn định hơn trước sự thay đổi trong độ phức tạp của ảnh. Điều này đã được hoàn thành ở bộ mã hóa thông qua mở rộng can thiệp phi tuyến giữa tầng biến đổi và tầng lượng tử hóa.
4.1.6 Phân tách tùy ý
Một phần mở rộng cung cấp phân tách tùy ý thành phần khối ảnh được mô tả trong Phụ lục F. Sự mở rộng này có thể kiểm soát mở rộng băng thông của các băng con sóng và vì thế cung cấp kiểm soát trên quá trình không tương quan để điều chỉnh hiệu năng nén. Sự mở rộng này cũng cho phép chuyển mã sóng con khác của các thuật toán nén gốc thành dòng mã của tiêu chuẩn này.
4.1.7 Biến đổi sóng con tùy ý
Những mở rộng cung cấp cho biến đổi các thành phần khối ảnh sử dụng các bộ lọc sóng con đã xác định người dùng được mô tả trong Phụ lục G và H. Phụ lục G mô tả toàn bộ các bộ lọc mẫu, trong khi đó Phụ lục H mô tả các bộ lọc tùy ý.
4.1.8 Biến đổi sóng con rời rạc chồng lấn mẫu riêng biệt
Các mở rộng cung cấp những biến đổi sóng con dựa trên khối được mô tả trong Phụ lục I. Các mở rộng này gồm một phương pháp đối với biến đổi sóng con dựa trên khối ảnh mà không tạo ra khối ảnh và một phương pháp đối với biến đổi sóng con dựa trên tế bào.
4.1.9 Biến đổi nhiều thành phần
Một phần mở rộng cung cấp những biến đổi nhiều thành phần như mô tả trong Phụ lục J. Mở rộng này đặc tả hai loại biến đổi nhiều thành phần:
1) Một đặc tính biến đổi nhiều thành phần sử dụng biến đổi các băng tần tuyến tính để giảm sự tương quan của mỗi băng. Điều này giống như hầu hết các biến đổi màu chung nhất.
2) Một đặc tính biến đổi sóng con dọc theo hướng thành phần.
4.1.10 Biến đổi phi tuyến
Phụ lục K đặc tả hai biến đổi điểm phi tuyến sử dụng sau quá trình giải mã và biến đổi nhiều thành phần hướng ngược để ánh xạ các giá trị được phục dựng trở về phạm vi đúng của chúng. Các biến đổi này, hệ số ảnh và bảng tra cứu (LUT) loại phi tuyến có thể được sử dụng bởi các bộ mã hóa trước khi biến đổi nhiều thành phần và mã hóa để gia tăng hiệu quả nén. Cách sử dụng chung của các biến đổi này có thể làm phẳng cảm nhận máy quét hoặc cảm biến bằng đáp ứng tuyến tính, độ chính xác trước khi nén từ 12 bit tới 8 bít.
4.1.11 Miền quan tâm
Một phần mở rộng cung cấp miền quan tâm mã hóa sử dụng phương pháp thang tỷ lệ gốc được mô tả trong Phụ lục L. Phương pháp thang tỷ lệ cung cấp các giá trị tỷ lệ khác nhau đối với các miền quan tâm khác nhau. Sự mở rộng cũng chỉ rõ làm thế nào để tạo nên mặt nạ trong miền sóng con mô tả thiết lập hệ số sóng con thuộc về mỗi miền quan tâm.
4.1.12 Định dạng tập tin
Một phần mở rộng của định dạng tập tin được mô tả trong Phụ lục M. Mở rộng này cung cấp sự thay đổi của các tệp ảnh đã nén giữa các môi trường ứng dụng. Mở rộng này là một định dạng tập tin Tùy chọn, gọi là JPX, các ứng dụng đó có thể lựa chọn sử dụng để chứa dữ liệu ảnh đã nén JPEG 2000. JPX là sự mở rộng của định dạng tập tin JP2 được xác định trong Phụ lục I của tiêu chuẩn ITU-T Rec. T.800 và ISO/IEC 15444-1. Định dạng:
1) Đặc tả đóng gói nhị phân đối với cả ảnh và siêu dữ liệu;
2) Đặc tả cơ chế biểu thị các thuộc tính ảnh, như thang tông màu hoặc khoảng ảnh;
3) Đặc tả cơ chế các bộ đọc có thể nhận ra sự tồn tại của thông tin bản quyền sở hữu trí tuệ trong tệp;
4) Đặc tả cơ chế siêu dữ liệu (bao gồm thông tin xác định nhà cung cấp) có thể bao hàm trong các tệp được đặc tả bởi tiêu chuẩn này;
5) Đặc tả cơ chế đa dòng mã có thể được kết hợp thành một sản phẩm riêng biệt nhờ các phương pháp như ảnh ghép và ảnh động.
4.1.13 Định nghĩa siêu dữ liệu
Định nghĩa siêu dữ liệu được mô tả trong Phụ lục N. Siêu dữ liệu là thông tin thêm vào kèm theo với dữ liệu sơ cấp (ảnh). Trong ngữ cảnh của đặc tính này, nó là “dữ liệu thêm vào được liên kết với dữ liệu hình ảnh khác với các điểm ảnh xác định ảnh”. Siêu dữ liệu có giá trị quan trọng nhất đối với người sở hữu và người sử dụng ảnh, cần phải được duy trì nhất quán thông qua thời gian sống của ảnh. Trong môi trường các ứng dụng biên tập ảnh ngày nay, truyền tải nhanh qua Internet và in ảnh chất lượng cao, thời gian sống của ảnh số có thể rất dài cũng như rất phức tạp.
4.2 Quan hệ giữa các phần mở rộng
Mối quan hệ về mặt giải mã giữa các phần mở rộng đã liệt kê ở trên như trong Hình 1. Các công nghệ được mô tả trong tiêu chuẩn ITU-T Rec. T.800 | ISO/IEC 15444-1 được chỉ ra trong khung.
Hình 1 – Sơ đồ khối giải mã
11/2005/QĐ-BTC
Phụ lục A
(Quy định)
Cú pháp nén dữ liệu, phần mở rộng
(Phụ lục là phần tích hợp với tiêu chuẩn)
Trong phụ lục này và các điều nhỏ của phụ lục, các biểu đồ và bảng chỉ có tính quy định trong trường hợp chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này xác định các điểm đánh dấu và dấu cú pháp mở rộng của ITU-T Rec. T.800 phụ lục cú pháp ISO/IEC 15444-1. Các nhãn cung, cấp tất cả hệ thống mã lệnh trong khuyến nghị này. Hơn nữa, dự kiến báo hiệu cần thiết cho tương lai thông số kỹ thuật bao gồm các khuyến nghị | Chuẩn quốc tế như là một tài liệu tham khảo bản quy phạm. Tất cả giá trị của số nguyên dương (không dấu) của tham số được đặt trong dòng mã như số nguyên không dấu. Tất cả các số nguyên (có dấu) được thể hiện trong bổ sung byte thứ hai. Trừ khi quy định khác, tất cả giá trị nằm trong trật tự Big-Endian. Một số thông số phân đoạn nhãn có giá trị được xác định với bít. Trong một số trường hợp có những bít, biểu thị bằng “x” mà không tương ứng với bất kỳ tham số nào và được sử dụng bởi tất cả các thông số. Dòng mã lệnh sẽ có giá trị bit số không cho những trường hợp. Các bộ giải mã sẽ bỏ qua các bít.
A.1 Khả năng mở rộng
Cú pháp trong phụ lục này hỗ trợ các phần mở rộng trong tiêu chuẩn này. Những phân đoạn nhãn tuân thủ với cùng các quy tắc tương tự như cú pháp trong ITU-T Rec. T.800 và ISO/IEC 15444-1 Phụ lục A. Việc bổ sung các giá trị tham số để một số phân đoạn nhãn trong ITU-T Rec. T.800 và ISO/IEC 15444-1 và việc bổ sung mới phân đoạn nhãn tín hiệu thông tin cụ thể cho các phần mở rộng trong tiêu chuẩn này. Trong mỗi phân đoạn nhãn hai byte đầu tiên sau khi đánh dấu sẽ là một giá trị không dấu, bắt đầu chiều dài theo byte của các thông số phân đoạn nhãn (bao gồm cả hai byte tham số chiều dài này nhưng không phải hai byte của điểm đánh dấu chính nó). Khi một phân đoạn nhãn không được xác định trong tiêu chuẩn này hoặc trong ITU-T Rec. T.800 và ISO/IEC 15444-1 gặp phải trong một dòng mã, các bộ giải mã phải sử dụng tham số chiều dài để loại bỏ các phân đoạn nhãn. Bảng A.1 biểu thị điểm đánh dấu các phân đoạn bị ảnh hưởng bởi tiêu chuẩn này.
Bảng A.1 – Cú pháp hỗ trợ mở rộng
Mở rộng |
Phân đoạn nhãn mở rộng ITU-T Rec. T.800 và ISO/IEC 15444-1 |
Phân đoạn nhãn mới |
Tất cả các mở rộng | SIZ | – |
Độ lệch DC biến thiên | – | DCO |
lượng tử hóa vô hướng biến thiên | QCD, QCC, SOT | QPD, QPC |
Lượng tử hóa mã hóa lưới | QCD, QCC, SOT | QPD, QPC |
Hình ảnh che | – | VMS |
Biến đổi bù mẫu đơn | SIZ, COD, COC | – |
Kiểu phân tách tùy ý | COD, COC | DFS, ADS |
Hạt nhân biến đổi tùy ý | COD, COC | ATK |
Biến đổi nhiều thành phần | COD | CBD, MCT, MCC, MCO |
Điểm Biến đổi không tuyến tính | – | NLT |
Tùy ý hình khu vực quan tâm | RGN | – |
A.2 Mở rộng đối với các tham số đánh dấu phân đoại của ITU-T Rec. T.800 | ISO/IEC 15444-1
Mục này mô tả các phần mở rộng để phân đoạn nhãn được xác định trong ITU-T Rec. T.800 và ISO/IEC 15444-1, Phụ lục A.
A.2.1 Kích cỡ ảnh và khối ảnh, mở rộng
Tham số khả năng Rsiz của ITU-T Rec. T.800 và ISO/IEC 15444-1 là cần thiết hoặc hữu ích của tiện ích mở rộng trong tiêu chuẩn này cho giải mã dòng lệnh. Bảng A.2 được sử dụng để xác định tham số này.
Bảng A.2 – Tham số năng lực Rsiz mở rộng
Giá trị (bits) |
Khả năng |
|
MSB |
LSB |
|
0000 0000 |
0000 0000 |
Năng lực chỉ được đặc tả trong ITU-T Rec. T.800 | ISO/IEC 15444-1 |
1000 xxxx |
xxxx xxxx |
Thể hiện ít nhất một trong các năng lực mở rộng của tiêu chuẩn này |
1000 xxx0 |
xxxx xxx1 |
Năng lực bù DC biến thiên được yêu cầu để giải mã dòng mã nàya)b) |
1000 xxxx |
xxxx xx1x |
Năng lực lượng tử hóa biến thiên vô hướng được yêu cầu để giải mã dòng mã nàya) |
1000 xxxx |
xxxx x1xx |
Năng lực lượng tử hóa mã Lưới là hữu ích để giải mã này dòng mã nàyc) |
1000 xxxx |
xxxx 1xxx |
Năng lực mặt nạ thị giác là hữu ích để giải mã dòng mã này c) |
1000 xxxx |
xxx1 xxxx |
Năng lực chồng lấn mẫu riêng rẽ được yêu cầu để giải mã dòng mã này a) |
1000 xxxx |
xx1x xxxx |
Năng lực loại phân tách tùy ý được yêu cầu để giải mã dòng mã này a) |
1000 xxxx |
x1xx xxxx |
Năng lõi biến đổi tùy ý được yêu cầu để giải mã dòng mã này a) |
1000 xxxx |
1xxx xxxx |
Năng lực lõi biến đổi đối xứng toàn bộ mẫu được yêu cầu để giải mã dòng mã nàya) |
1000 xxx1 |
xxxx xxxx |
Năng lực biến đổi nhiều thành phần được yêu cầu để giải mã dòng mã này a) |
1000 xx1x |
xxxx xxxx |
Năng lực biến đổi điểm phi tuyến rất hữu ích để giải mã dòng mã này c) |
1000 x1xx |
xxxx xxxx |
Năng lực miền quan tâm đã bị bóng mờ tùy ý được yêu cầu để giải mã dòng mã này a) |
1000 1xxx |
xxxx xxxx |
Lượng tử hóa khu vực phụ thuộc được yêu cầu để giải mã dòng mã nàya) |
|
|
Tất cả các giá trị khác được dự trữ |
a) “Yêu cầu để giải mã” ngụ ý rằng không có dữ liệu hữu ích hoặc ảnh có thể được phục dựng mà không sử dụng năng lực này.
b) Sẽ không được sử dụng với biến đổi nhiều thành phần.
c) “Hữu ích để giải mã” ngụ ý rằng sử dụng năng lực này sẽ cải thiện chất lượng của dữ liệu phục dựng hoặc ảnh; Tuy nhiên, dữ liệu hoặc ảnh có thể được giải mã mà không sử dụng nó.
A.2.2 Bắt đầu phần khối ảnh (SOT) mở rộng
Nếu Rsiz chỉ ra rằng khả năng lượng tử hóa phụ thuộc vào khu vực được sử dụng, sau đó phân đoạn nhãn SOT từ ITU-T Rec. T.800 và ISO/IEC 15444-1, Phụ lục A, được mở rộng để cho phép 1-65535 phần khối ảnh. Bảng A.3 thay thế ITU-T Rec. T.800 và ISO/IEC 15444-1, Bảng A.5 và Bảng A.4 thay thế ITU-T Rec. T.800 và ISO/IEC 15444-1 Bảng A.6.
Bảng A.3 – Bắt đầu của các giá trị tham số phần khối ảnh, mở rộng
Các tham số |
Kích thước (bits) |
Giá trị |
SOT |
16 |
0xFF90 |
Lsot |
16 |
10 |
Isot |
16 |
0-65 534 |
Psot |
32 |
0, hoặc 14-(232–1) |
TPsot |
16 |
0-65535 |
TNsot |
16 |
Bảng A.4 |
Bảng A.4 – Số lượng phần khối ảnh, TNsot, giá trị tham số, mở rộng
Giá trị |
Số phần khối ảnh |
0 |
Số lượng phần khối ảnh này trong dòng mã không được định nghĩa trong tiêu đề này |
1-65535 |
Số lượng phần khối ảnh trong dòng mã |
A.2.3 Kiểu mã (COD, COC), mở rộng
Thao tác hình học được kích hoạt với hai bit trong tham số Scod được hiển thị trong bảng A.5. Nếu trường Rsiz của đoạn đánh dấu SIZ chỉ ra rằng các biến đổi nhiều thành phần được sử dụng thì bảng A.8 thay thế ITU-T Rec. T.800 và ISO/IEC 15444-1 Bảng A.17.
Nếu trường Rsiz của đoạn đánh dấu SIZ chỉ ra rằng các hạt nhân biến đổi tùy ý được sử dụng, thì Bảng A.10 thay thế ITU-T Rec. T.800 và ISO/IEC 15444-1 Bảng A.20.
Nếu trường Rsiz của đoạn đánh dấu SIZ chỉ ra rằng khả năng Biến đổi chồng chéo của mẫu duy nhất là cần thiết, thì độ dài 8 bit phụ được thêm vào ITU-T Rec. T.800 và ISO/IEC 15444-1 Bảng A.13 sau trường Biến đổi như thể hiện trong Bảng A.7. Các giá trị SSO được tìm thấy trong Bảng A.11.
Nếu trường Rsiz của đoạn đánh dấu SIZ chỉ ra rằng các kiểu tùy ý phân rã được sử dụng thì số lượng tối đa của định nghĩa khu vực mà mức độ phân rã được tìm thấy trong Bảng A.9 hơn là trong ITU-T Rec. T.800 và ISO/IEC 15444-1 Bảng A.13. Điều này được thể hiện trong Bảng A.7.
Bảng A.5 – Kiểu mã hóa tham số giá trị cho tham số Scod
Giá trị (bits) |
Kiểu mã hóa |
|
MSB |
LSB |
|
xxxx |
xxx0 |
Dữ liệu ngẫu nhiên coder, các Khu vực với PPx = 15 và PPy =15 |
xxxx |
xxx1 |
Dữ liệu ngẫu nhiên coder với Khu vực được định nghĩa dưới |
xxxx |
xx0x |
Không có phân đoạn nhãn SOP được sử dụng |
xxxx |
xx1x |
SOP phân đoạn nhãn có thể được sử dụng |
xxxx |
x0xx |
Không có đánh dấu EPH sử dụng |
xxxx |
x1xx |
Đánh dấu EPH được sử dụng |
xxxx xxxx |
0xxx 1xxx |
Bù đắp trong kích thước ngang, zX = 0 (CBAP) Bù đắp trong kích thước ngang, zX = 1 |
xxx0 xxx1 |
xxxx xxxx |
Bù đắp trong chiều thẳng đứng, zY = 0 (CBAP) Bù đắp trong chiều thẳng đứng, zY = 1 |
|
|
Tất cả các giá trị khác được dành riêng |
Bàn A.6 – Mã hóa kiểu tham số giá trị của tham số SGcod
Các tham số (theo thứ tự) |
Kích thước (bits) |
Giá trị |
Ý nghĩa của các giá trị SGcod |
Thứ tự tiến trình |
8 |
ITU-T Rec. T.800 | ISO/IEC 15444-1 Bảng A.16 | Thứ tự tiến trình |
Số lớp |
16 |
1-65535 | Số lớp |
Biến đổi nhiều thành phần |
8 |
Bảng A.8 | Sử dụng Biến đổi nhiều thành phần |
Bản A.7 – Kiểu mã hóa tham số giá trị của tham số SPcod và SPcoc, mở rộng
Các tham số (theo thứ tự) |
Kích thước (bits) |
Giá trị (bits) MSB LSB |
Ý nghĩa của các giá trị SPcod |
Số lượng tối đa độ phân hủy |
8 |
Bảng A.9 | Ánh xạ phân rã và mức độ |
Độ rộng khối mã |
8 |
ITU-T Rec. T.800 | ISO/IEC 15444-1 Bảng A.18 | chiều rộng khối mã số mũ bù đắp giá trị, xcb |
Chiều cao khối mã |
8 |
ITU-T Rec. T.800 | ISO/IEC 15444-1 Bảng A.18 | chiều cao khối mã giá trị bù đắp số mũ, ycb |
Kiểu khối mã |
8 |
ITU-T Rec. T.800 | ISO/IEC 15444-1 Bảng A.19 | Kiểu của khối mã hóa mã đi |
Biến đổi |
8 |
Bảng A.10 | Biến đổi sóng được sử dụng |
SSO chồng chéo |
16 |
Bảng A.11 | SSO chồng chéo giá trị |
Kích thước khu |
biến |
ITU-T Rec. T.800 | ISO/IEC 15444-1 Bảng A.21 | Nếu Scod hoặc Scoc = xxxx xxx0, tham số này không phải là xuất hiện, nếu không, điều này cho thấy Khu vực chiều rộng và chiều cao. Các tham số đầu tiên (8 bit) tương ứng với băng phụ NLLL, NLLX, hoặc NLXL Mỗi tham số liên tiếp tương ứng với mỗi giải quyết tiếp theo thứ tự. |
Bảng A.8 – Biến đổi nhiều thành phần cho các tham số Sgcod
Giá trị (bits) |
Loại biến đổi nhiều thành phần |
|
MSB |
LSB |
|
0000 |
0000 |
Không có biến đổi thành phần nhiều quy định. |
0000 |
0001 |
Biến đổi thành phần sử dụng trên các thành phần 0, 1, 2 cho hiệu quả mã hóa. Không thể thay đổi thành phần Biến đổi được sử dụng với bộ lọc không thể đảo ngược. Đảo ngược thành phần Biến đổi được sử dụng với bộ lọc đảo ngược. |
0000 |
0x10 |
Ma trận dựa trên Biến đổi nhiều thành phần được sử dụng. Có thể được kết hợp với sóng dựa trên Biến đổi nhiều thành phần. |
0000 |
01×0 |
Sóng dựa trên Biến đổi nhiều thành phần được sử dụng. Có thể được kết hợp với ma trận dựa trên Biến đổi nhiều thành phần. |
|
|
Tất cả các giá trị được dự phòng. |
Bảng A.9 – Phân rã cho các tham số SPcod và SPcoc, mở rộng
Giá trị (bits) |
Loại phân rã |
|
MSB |
LSB |
|
0000 |
0000 |
Số đơn vị phân rã sóng, phân rã dyadic, NL (Zero ngụ ý không biến đổi). |
1000 |
0001 |
Nếu trong tiêu đề chính: yếu tố kiểu giảm lượng tử chỉ số giá trị (1 to 127). (Xem A.3.3.)
Nếu phần tiêu đề ngói: phân rã kiểu tùy ý chỉ số giá trị (1 đến 127). (Xem A.3.4.) |
|
|
Tất cả các giá trị khác được dành riêng |
Bảng A.10 – Biến đổi các tham số SPcod và SPcoc, mở rộng
Giá trị (bits) |
Loại biến đổi |
|
MSB |
LSB |
|
0000 |
0000 |
ITU-T Rec. T.800 | ISO/IEC 15444-1 9-7 Biến đổi Sóng không thể đảo ngược. |
0000 |
0001 |
ITU-T Rec. T.800 | ISO/IEC 15444-1 5-3 biến đổi đảo ngược sóng. |
0000 |
0010 |
Biến đổi hạt nhân Tùy ý định nghĩa chỉ số (2-255). Định nghĩa được tìm thấy trong phân khúc đánh dấu ATK thích hợp (Xem A.3.5). |
Bảng A.11 – Tham số SSO, mở rộng
Giá trị (bits) |
Kích thước SSO (Xem phục lục I) |
|
MSB |
LSB |
|
0xxx xxxx |
xxxx xxxx |
SSO không được sử dụng |
1xxx xxxx |
xxxx xxxx |
SSO được sử dụng |
x0xx xxxx |
xxxx xxxx |
TSSO không được sử dụng cho mỗi ngói trong ảnh (sẽ là như nhau trong mọi phân khúc đánh dấu COD) |
x1xx xxxx |
xxxx xxxx |
TSSO được sử dụng cho mỗi ngói trong ảnh (sẽ là như nhau trong mọi phân khúc đánh dấu COD) |
xx0x xxxx xx1x xxxx |
xxxx xxxx xxxx xxxx |
Vovlp = 0 (sẽ là như nhau trong mọi phân khúc đánh dấu COD)
Vovlp = 1(sẽ là như nhau trong mọi phân khúc đánh dấu COD) |
xxx0 xxxx xxx1 xxxx |
xxxx xxxx xxxx xxxx |
Hovlp = 0 (sẽ là như nhau trong mọi phân khúc đánh dấu COD)
Hovlp = 1 (sẽ là như nhau trong mọi phân khúc đánh dấu COD) |
xxxx 0xxx x1xx 1xxx |
xxxx xxxx xxxx xxxx |
TBDWT không sử dụng (sẽ như nhau trong mọi phân khúc đánh dấu COD)
TBDWT được sử dụng (sẽ là như nhau trong mọi phân khúc đánh dấu COD) |
xxxx xxxx đến xxxx xxxx |
xxxx 0000 đến xxxx 1111 |
Giá trị số mũ chiều rộng di động, XC = 2giá trị |
xxxx xxxx đến xxxx xxxx |
0000 xxxx đến 1111 xxxx |
Chiều cao giá trị số mũ chiều cao di động, YC = 2giá trị |
|
|
Tất cả các giá trị khác được dành riêng |
A.2.4 Lượng tử hóa (QCD, QCC), mở rộng
Nếu Rsiz chỉ ra rằng khả năng lượng tử hóa vô hướng biến đổi (xem Phụ lục C) được sử dụng, thì điều chỉnh miền không đổi báo hiệu trong lần QCD và QCC đánh dấu các phân đoạn ITU-T Rec. T.800 và ISO/IEC 15444-1, Phụ lục A. Nếu Rsiz chỉ ra rằng sự lượng tử mã hóa ngoài được sử dụng, thì các giá trị này cũng được báo hiệu thông qua mở rộng QCD và đánh dấu QCC phân đoạn ITU-T Rec. T.800 và ISO/IEC 15444-1, Phụ lục A. Điều này sẽ chỉ được sử dụng với các biến đổi không đảo ngược. Bảng A.12 thay thế ITU-T Rec. T.800 và ISO/IEC 15444-1 Bảng A.28, và Bảng A.13 thay thế ITU-T Rec. T.800 và ISO/IEC 15444-1 Bảng A.30.
Bảng A.12 – Sự lượng tử hóa giá trị mặc định cho tham số Sqcd, Sqcc, Sqpd, và Sqpc, mở rộng
Giá trị (bits) |
Kiểu lượng tử hóa |
Kích thước SPqxx (bits) |
Cách sử dụng SPqxx |
|
MSB |
LSB |
|||
xxx0 |
0000 |
Không có sự lượng tử hóa |
8 |
ITU-T Rec. T.800 | ISO/IEC 15444-1 Phụ lục A |
xxx0 |
0001 |
Vô hướng có nguồn gốc (giá trị báo hiệu cho NLLL). Sử dụng ITU-T Rec. T.800 | ISO/IEC 15444-1 Phương trình E-5. |
16 |
ITU-T Rec. T.800 | ISO/IEC 15444-1 Phụ lục A |
xxx0 |
0010 |
Trình bày vô hướng (giá trị báo hiệu cho nhánh phụ). Có như nhiều kích thước bước báo hiệu như có băng phụ. |
16 |
ITU-T Rec. T.800 | ISO/IEC 15444-1 Phụ lục A |
xxx0 |
0011 |
Miền không đổi biến thiên có nguồn gốc (giá trị báo hiệu cho NLLL chỉ cho băng phụ). Sử dụng ITU-T Rec. T.800 | ISO/IEC 15444-1 Phương trình E-5. |
32 |
Bảng A.13 |
xxx0 |
0100 |
Miền không đổi biến thiên có nguồn gốc và vô hướng phân tích (giá trị báo hiệu cho mỗi băng phụ). Có nhiều kích thước bước báo hiệu như có băng phụ |
16 |
Bảng A.14 sau đó bảng A.15 |
xxx0 |
0101 |
Miền không đổi biến thiên và trình bày vô hướng (giá trị báo hiệu cho mỗi băng phụ), như nhiều kích thước bước báo hiệu như có băng phụ |
32 |
Bảng A.13 |
xxx0 |
1001 |
Mã hoá lượng tử hóa ngoài có nguồn gốc (giá trị báo hiệu cho NLLL băng phụ). Sử dụng ITU-T Rec. T.800 | ISO/IEC 15444-1 Phương trình E-5. |
16 |
ITU-T Rec. T.800 | ISO/IEC 15444-1 Phụ lục A |
xxx0 |
1010 |
Mã hóa lượng tử hóa ngoài được mô tả (giá trị báo hiệu cho mỗi băng phụ). Như nhiều kích thước bước báo hiệu như có băng phụ. |
16 |
ITU-T Rec. T.800 | ISO/IEC 15444-1 Phụ lục A |
000x đến 111x |
xxxx đến xxxx |
Số bit bảo vệ 0-7. |
|
|
|
|
Tất cả các giá trị khác dùng dự phòng |
|
Bảng A.13 – Giá trị lượng tử hóa (chỉ Biến đổi không đảo ngược), mở rộng
Giá trị (bits) |
Điều chỉnh miền không đổi và các giá trị kích cỡ bước lượng tử hóa |
|
MSB |
LSB |
|
0000 0000 0000 0000 đến 1111 1111 1111 1111 |
xxxx xxxx xxxx xxxx đến xxxx xxxx xxxx xxxx |
Miền không đổi biến thiên, num_nzb, giá trị -32 768-32 767 (xem phương trình C-1) |
xxxx xxxx xxxx xxxx đến xxxx xxxx xxxx xxxx |
xxxx x000 0000 0000 đến xxxx x111 1111 1111 |
Phần định trị, μb, giá trị kích thước bước sự lượng tử hóa 0-2 047 (xem ITU-T Rec. T.800 | ISO/IEC 15444-1 Phương trình E-3) |
XXXX xxxx xxxx xxxx đến xxxx xxxx xxxx xxxx |
0000 0xxx xxxx xxxx đến 1111 1xxx xxxx xxxx |
Số mũ, εb, giá trị kích thước bước sự lượng tử hóa 0-31 (xem ITU-T Rec. T.800 | ISO/IEC 15444-1 Phương trình E-3) |
Bảng A.14 – Các tham số SPqcd, SPqcc, SPqpd và SPqpc (chỉ biến đổi không thuận nghịch), mở rộng
Giá trị (bits) |
Giá trị điều chỉnh miền không đổi (chỉ cho mỗi băng con) |
|
MSB |
LSB |
|
0000 0000 đến 1111 1111 |
0000 0000 đến 1111 1111 |
Hai byte đầu tiên của SPqcx là điều chỉnh miền không đổi, num_nzb, giá trị -32 768-32 767 (xem phương trình C-1) |
Bảng A.15 – Các tham số SPqcd, SPqcc, SPqpd và SPqpc (chỉ biến đổi không thuận nghịch), mở rộng
Giá trị (bits) |
Giá trị kích thước bước lượng tử |
|
MSB |
LSB |
|
xxxx x000 đến xxxx x111 |
0000 0000 đến 1111 1111 |
Sau hai byte đầu tiên của SPqcx là phần định trị, □b, giá trị kích thước bước lượng tử hóa 0-2 047 (Xem ITU-T Rec. T.800 | ISO/IEC 15444-1 Phương trình E-3) |
0000 0xxx đến 1111 1xxx |
xxxx xxxx đến xxxx xxxx |
Sau hai byte đầu tiên của SPqcx là số mũ, □b, giá trị kích thước bước lượng tử hóa 0-31 (Xem ITU-T Rec. T.800 | ISO/IEC 15444-1 Phương trình E-3) |
A.2.5 Nhãn miền quan tâm (RGN), mở rộng
Nếu Rsiz chỉ ra rằng một khu vực quan tâm tùy ý được sử dụng (xem phụ lục L), thì các mô tả về một thay đổi hệ số và mặt nạ được báo hiệu tại một lần RGN phân đoạn nhãn từ Khuyến nghị T800 của ITU| Tiêu chuẩn ISO/IEC 15444-1, phụ lục A. Bảng A.16 thay thế Khuyến nghị T800 của ITU| Tiêu chuẩn ISO/IEC 15444-1 bảng A.25. Nếu có RGN phân đoạn nhãn trong tiêu đề chính với Srgn = 0, sẽ không có bất kỳ phân đoạn nhãn RGN bất cứ nào trong dòng mã với giá trị Srgn khác không (0) cho các thành phần được đưa ra bởi giá trị Crgn tương ứng. Tương tự như vậy, nếu không có RGN phân đoạn nhãn trong tiêu đề chính với một giá trị Srgn không bằng không, sẽ không có bất kỳ phân đoạn nhãn RGN nào trong dòng mã với một Srgn = 0 cho các thành phần được đưa ra bởi giá trị Crgn tương ứng. Khi được sử dụng trong tiêu đề chính và tiêu đề phần khối ảnh đầu tiên, RGN trong tiêu đề đầu tiên phần khối ảnh sẽ ghi đè chính ngói đó. Ngoài ra, RGN xác định một thành phần duy nhất (Crgn (65 535) sẽ thay thế trên xác định tất cả các thành phần (Crgn = 65 535).
Do đó thứ tự ưu tiên sẽ là như sau:
Phần khối ảnh RGN (Crgn ≠ 65 535) > Phần khối ảnh RGN (Crgn = 65 535) > Cơ bản RGN (Crgn ≠ 65 535) > Cơ bản RGN (Crgn = 65 535)
Trong đó các dấu “lớn hơn”, >, có nghĩa là các phân đoạn nhãn lớn hơn ghi đè các phân đoạn nhãn ít hơn.
Bảng A.16 – Giá trị tham số miền quan tâm đối với tham số Srgn
Giá trị |
Loại ROI (Srgn) |
Cách dùng SPrgn |
0 |
Tiềm ẩn ROI (tối đa sự thay đổi) | 4.3 ITU-T Rec. T.800 | ISO/IEC 15444-1
Bảng A.26 |
1 |
Khu vực quan tâm tùy ý, hình chữ nhật | Bảng A.18 |
2 |
Khu vực quan tâm tùy ý, hình elip | Bảng A.18 |
|
Tất cả các giá trị khác được dành riêng |
Bảng A.17 – Giá trị tham số chỉ số thành phần đối với tham số Crgn
Tham số |
Kích thước (bits) |
Giá trị |
Tham số chỉ số thành phần |
Thành phần |
16 |
0-16 383 16 394-65 354 65 535 |
Chỉ định các thành phần để mà các vùng của mô tả lãi suất áp dụng
Dành riêng Khu vực quan tâm mô tả áp dụng cho tất cả các thành phần |
Bảng A.18 – Giá trị miền quan tâm từ tham số SPrgn (Srgn = 1 hoặc Srgn = 2)
Tham số |
Kích thước (bits) |
Giá trị |
Ý nghĩa của tham số SPrgn |
Dịch chuyển nhị phân |
8 |
0-255 |
Dịch chuyển nhị phân của hệ số trong vùng quan tâm trên nền. |
XArgn (trái) |
32 |
0-(232 -1) |
Điểm lưới tham chiếu ngang từ nguồn của điểm đầu tiên. (Trong trường hợp của hình elip, Srgn = 2, giá trị này sẽ không vượt quá chiều rộng của ảnh.) |
YArgn (trên) |
32 |
0-(232 -1) |
Điểm lưới tham chiếu dọc từ nguồn của điểm đầu tiên. (Trong trường hợp của hình elip, Srgn = 2, giá trị này sẽ không vượt quá chiều cao của ảnh.) |
XBrgn (Phải) |
32 |
0-(232 -1) |
Điểm lưới tham chiếu dọc ngang từ nguồn của điểm thứ hai. |
YBrgn (Dưới) |
32 |
0-(232 -1) |
Điểm lưới tham chiếu dọc từ nguồn của điểm thứ hai. |
A.3 Các đoạn nhãn mở rộng
Bảng A.19 liệt kê các đánh dấu được chỉ định trong tiêu chuẩn này.
Bảng A.19 – Danh sách các nhãn và phân đoạn nhãn
Ký hiệu |
Mã |
Tiêu đề chính a) |
Phần tiêu đề khối ảnh a) |
|
Biến DC bù |
DCO |
0xFF70 |
Tùy chọn |
Tùy chọn |
Mặt nạ thị giác |
VMS |
0xFF71 |
Tùy chọn |
Tùy chọn |
Kiểu yếu tố Giảm lượng tử f |
DFS |
0XFF72 |
Tùy chọn |
Tùy chọn |
Kiểu phân rã tùy ý |
ADS |
0XFF73 |
Tùy chọn |
Tùy chọn |
Hạt nhân biến đổi tùy ý |
ATK |
0xFF79 |
Tùy chọn |
Tùy chọn |
Độ sâu bit thành phần |
CBD |
0XFF78 |
Tùy chọn |
Tùy chọn |
Nhiều thành phần Biến đổi định nghĩa |
MCT |
0xFF74 |
Tùy chọn |
Tùy chọn |
Sưu tập nhiều thành phần |
MCC |
0xFF75 |
Tùy chọn |
Tùy chọn |
Thứ tự Biến đổi nhiều thành phần |
MCO |
0xFF77 |
Tùy chọn |
Tùy chọn |
Điểm Biến đổi không tuyến tính |
NLT |
0xFF76 |
Tùy chọn |
Tùy chọn |
Sự lượng tử hóa mặc định, Khu vực |
QPD |
0xFF5A |
Tùy chọn |
Tùy chọn |
Sự lượng tử hóa thành phần, Khu vực |
QPC |
0xFF5B |
Tùy chọn |
Tùy chọn |
a) Yêu cầu có nghĩa là điểm nhãn hay phân đoạn nhãn sẽ trong tiêu đề này nếu phần mở rộng này được sử dụng. Tùy chọn có nghĩa là nó có thể được sử dụng trong tiêu đề nếu phần mở rộng này được sử dụng. |
A.3.1 Độ lệch DC biến đổi (DCO)
Chức năng: Mô tả độ lệch DC thay đổi cho mỗi thành phần.
Sử dụng: Hiện nay, chỉ nếu bit khả năng độ lệch DC trong tham số Rsiz (xem A.2.1) là một giá trị. Tiêu đề hình và tiêu đề ngói đầu tiên của một ngói nhất định. Tùy chọn trong các tiêu đề chính và phần ngói. Không có nhiều hơn một sẽ xuất hiện trong bất kỳ tiêu đề. Nếu có trong tiêu đề chính, nó mô tả độ lệch DC thay đổi cho mỗi thành phần trong mỗi ngói. Nếu có trong tiêu đề ngói phần đầu tiên của một ngói nhất định, nó mô tả đối tượng độ lệch DC thay đổi cho mỗi thành phần chỉ trong ngói đó. Khi được sử dụng trong tiêu đề chính và tiêu đề phần khối ảnh đầu tiên, DCO trong tiêu đề đầu tiên phần khối ảnh sẽ ghi đè chính ngói đó. Do đó, thứ tự ưu tiên như sau:
Phần khối ảnh DCO > Cơ bản DCO .Trong đó các dấu hiệu “lớn hơn”, >, có nghĩa là phân đoạn nhãn lớn hơn ghi đè các phân đoạn nhãn ít hơn. Sẽ không được sử dụng với nhiều biến đổi thành phần.
Chiều dài: Các thay đổi tùy thuộc vào số lượng các thành phần.
Hình A.1 – Cú pháp bù DC biến đổi
DCO: Mã nhãn. Bảng A.20 Hiển thị các giá trị kích thước và tham số cho kiểu mã hóa thành phần phân đoạn nhãn
Ldco: Chiều dài của phân đoạn nhãn theo byte (không bao gồm các điểm đánh dấu). Giá trị của tham số này được xác định bởi phương trình sau đây:
Trong đó Csiz từ ITU-T Rec. T.800 | ISO/IEC 15444-1 Phụ lục A.
CHÚ Ý- nếu Ldco đã lớn hơn 65 535, thì các DCO phân đoạn nhãn không thể được sử dụng. Thay vào đó, nhiều thành phần Biến đổi chức năng có thể được sử dụng.
Sdco: Định nghĩa loại độ lệch DC thay đổi.
SPdcoi: Biến DC bù cho các thành phần thứ i. Có là một tham số SPdco cho mỗi thành phần trong ảnh.
Bảng A.20 – Giá trị tham số bù DC biến đổi
Tham số |
Kích cỡ (bits) |
Giá trị |
DCO |
16 |
0xFF70 |
Ldco |
16 |
5-32 770 |
Sdco |
8 |
Bảng A.21 |
SPdcoi |
biến |
Bảng A.21 |
Bảng A.21 – Các giá trị tham số bù DC biến đổi đối với tham số Sdco
Giá trị (bits) |
Xác định loại bù |
|
MSB |
LSB |
|
0000 |
0000 |
Bù 8 bit số nguyên không đánh dấu |
0000 |
0001 |
Bù 16 bit số nguyên có đánh dấu |
0000 |
0010 |
Bù 32-bit dấu phẩy động (IEEE Std. 754-1985 R1990) |
0000 |
0011 |
Bù 64-bit dấu phẩy động (IEEE Std. 754-1985 R1990) |
|
|
Tất cả các giá trị khác được dự phòng |
Các số IEEE như đã sử dụng trong dòng mã ISO/IEC 15444-2 phải được ghi theo thứ tự big-endian, sử dụng các đoạn bit sau cho mã hóa số lượng điểm động:
SEEE EEEE EMMM MMMM MMMM MMMM MMMM MMMM
Với các số IEEE độ chính xác đơn, ở đây S = Bit tín hiệu, E = Bit số mũ, M = Bit định trị
SEEE EEEE EEEE MMMM MMMM MMMM MMMM MMMM MMMM MMMM MMMM MMMM MMMM MMMM MMMM MMMM
Với các số IEEE độ chính xác kép, ở đây S = Bit tín hiệu, E = Bit số mũ, M = Bit định trị
Chú thích 2 – Mã hóa này yêu cầu một endian-swap đặc thù trên máy litle-endian và mã hóa riêng đặc thù đối với máy big-endian.
A.3.2 Mặt nạ thị giác (VMS)
Chức năng: Mô tả trực quan che cho tất cả ảnh khối – các thành phần trong ảnh hoặc ảnh khối.
Sử dụng: Hiện nay, nếu chỉ khả năng ảnh mặt nạ bit trong tham số Rsiz (xem A.2.1) có giá trị một. Tùy chọn được sử dụng trong tiêu đề chính và/hoặc tiêu đề ngói phần đầu tiên của một ngói nhất định. Không có nhiều hơn một VMS phân đoạn nhãn cho một thành phần sẽ xuất hiện trong bất kỳ tiêu đề nào. Khi được sử dụng trong tiêu đề chính và tiêu đề phần khối ảnh đầu tiên, đoạn VMS đánh dấu trong tiêu đề đầu tiên phần khối ảnh sẽ thay thế một trong các tiêu đề chính cho ngói đó. Một VMS phân đoạn nhãn chỉ định một thành phần duy nhất (Cvms ≠ 65 535) sẽ thay thế tất cả các thành phần (Cvms = 65 535). Do đó, thứ tự ưu tiên là sau đây:
Phần khối ảnh VMS (Cvms ≠ 65 535) > Phần khối ảnh VMS (Cvms = 65 535) > Cơ bản VMS (Cvms ≠ 65 535) > Cơ bản VMS (Cvms = 65 535)
Trong đó các dấu hiệu “lớn hơn”, >, có nghĩa là phân đoạn nhãn lớn hơn ghi đè các phân đoạn nhãn ít hơn.
Length: Cố định
Hình A.2 – Cú pháp mặt nạ thị giác
VMS: Mã đánh dấu. Bảng A.22 Hiển thị các giá trị kích thước và tham số cho kiểu mã hóa, mặc định phân đoạn nhãn.
Lvms: Chiều dài của phân đoạn nhãn theo byte (không bao gồm các điểm đánh dấu). Cố định ở 7 byte.
Cvms: Chỉ số của các thành phần mà phân khúc đánh dấu này áp dụng. Có thể là tất cả các thành phần.
Svms: Mức độ phân giải tối thiểu và tôn trọng ranh giới cờ
Wvms: Cửa sổ chiều rộng biến, win_width (xem E.6).
Rvms: Bit giữ lại thay đổi, bits_retained (xem E.6).
Avms: Giá trị của tử số tham số α, α = Avms/128 (xem E.6).
Bvms: Giá trị của tử số tham số β, β = Bvms/128 (xem E.6).
Bảng A.22 – Các giá trị tham số mặt nạ thị giác
Tham số |
Kích thước (bits) |
Giá trị |
VMS |
16 |
0xFF71 |
Lvms |
16 |
9 |
Cvms |
16 |
Bảng A.23 |
Svms |
8 |
Bảng A.24 |
Wvms |
8 |
0-8 |
Rvms |
8 |
0-255 |
Avms |
8 |
0-255 |
Bvms |
8 |
0-255 |
Bảng A.23 – Giá trị các tham số thành phần đối với tham số Cvms
Giá trị |
Tham số chỉ số thành phần |
0-16 383 16 394-65 354 65 535 |
Chỉ định các thành phần mà những Khu vực quan tâm áp dụng mô tả
Dành riêng Các khu vực quan tâm mô tả áp dụng cho tất cả các thành phần |
Bảng A.24 – Mặt nạ thị giác đối với các tham số Svms
Giá trị (bits) |
Các tham số hình ảnh che |
|
MSB |
LSB |
|
x000 đến x001 |
0000 đến 0000 |
Giá trị mức phân giải tối thiểu, mức thấp nhất (0-32) (xem E.6) |
0xxx |
xxxx |
Biến respect_block_boundaries = 0 (xem E.6) |
1xxx |
xxxx |
Biến respect_block_boundaries = 1 (xem E.6) |
|
|
Tất cả các giá trị khác dùng cho dự phòng |
A.3.3 Các dạng hệ số giảm mẫu (DFS)
Length: Thay đổi
Hình A.3 – Cú pháp các dạng hệ số giảm mẫu
DFS: Mã đánh dấu. Bảng A.26 Hiển thị kích thước và các giá trị của các biểu tượng và các tham số cho dạng mã hóa, phân đoạn nhãn mặc định.
Ldfs: Chiều dài của phân đoạn nhãn theo byte (không bao gồm các điểm đánh dấu). Giá trị của tham số này được xác định bởi phương trình sau đây: Ldfs = 4 + (A-2)
Sdfs: Chỉ số phân đoạn nhãn này DFS. Phân đoạn nhãn này được kết hợp với một thành phần thông qua các tham số trong phân đoạn nhãn COD hoặc COC tìm thấy trong tiêu đề chính.
Idfs: Số lượng của các phần tử trong chuỗi xác định số lượng phân rã cấp phụ.
Ddfs: Chuỗi xác định số lượng phân rã cấp phụ. Hai bit thành phần được đóng gói vào byte trong thứ tự big-endian, byte cuối cùng thêm vào byte ranh giới.
Table A.25 – Các giá trị tham số dạng hệ số mẫu suy giảm
Tham số |
Kích thước (bits) |
Giá trị |
DFS |
16 |
0xFF72 |
Ldfs |
16 |
5-65 535 |
Sdfs |
16 |
0-15 |
ldfs |
8 |
0-255 |
Ddfs |
Biến đổi |
Chuỗi của các phần tử |
A.3.4 Dạng phân tách tùy ý (ADS)
Chức năng: Mô tả các mô hình phân rã tùy ý cho một thành phần khối ảnh hoặc tất cả ngói thành phần trong một ngói duy nhất.
Sử dụng: Hiện tại nếu chỉ có dạng khả năng phân rã tùy chỉnh trong tham số Rsiz (xem A.2.1) là một giá trị. Sẽ không được sử dụng để mô tả sự phân rã được mô tả trong Khuyến nghị T800 của ITU| Tiêu chuẩn ISO/IEC 15444-1 phụ lục F. Tiêu đề chính và tiêu đề phần khối ảnh đầu tiên của ngói nhất định. Có thể lên đến 127 các phân đoạn nhãn với chỉ số giá trị duy nhất. Nếu giá trị chỉ số được tìm thấy ở một tiêu đề phần ngói, sau đó nó được sử dụng thay vì phân đoạn nhãn ADS trong tiêu đề chính với cùng một chỉ số giá trị. Được gán cho một ngói thành phần cụ thể thông qua các tham số trong phân đoạn nhãn COD hoặc COC chỉ có ở một tiêu đề phần khối ảnh cụ thể.
Length: Biến đổi
Hình A.4 – Cú pháp dạng phân giải tùy ý
ADS: Mã đánh dấu. Bảng A.26 Hiển thị kích thước và các giá trị của các biểu tượng và các tham số cho dạng mã hóa, mặc định phân đoạn nhãn.
Lads: Chiều dài của phân đoạn nhãn theo byte (không bao gồm các điểm đánh dấu). Giá trị của tham số này được xác định bởi phương trình sau đây:
(A-3)
Sads: Chỉ số đánh dấu phân đoạn ADS. Phân đoạn nhãn này được kết hợp với một thành phần thông qua các tham số trong phân đoạn nhãn COD hoặc COC tìm thấy trong tiêu đề phần khối ảnh đó.
lOads: Số lượng số lược các thành phần trong chuỗi xác định số lượng phân rã cấp phụ.
DOads: Chuỗi xác định số lượng phân rã cấp phụ. Hai bit được đóng gói vào byte trong đơn thứ tự big-endian. Các byte cuối cùng thêm vào ranh giới.
ISads: Số lượng các thành phần trong chuỗi xác định cấu trúc phân rã tùy ý.
DSads: Chuỗi xác định cấu trúc phân rã tùy ý. Hai bit được đóng gói vào byte trong thứ tự big-endian. Các byte cuối cùng thêm và byte ranh giới.
Bảng A.26 – Các giá trị tham số dạng phân giải tùy ý
Tham số |
Kích thước (bits) |
Giá trị |
ADS |
16 |
0xFF73 |
Lads |
16 |
3-65 535 |
Sads |
8 |
1-127 |
lOads |
8 |
0-255 |
DOads |
Biến đổi |
Chuỗi các phần tử |
ISads |
8 |
0-255 |
DSads |
Biến đổi |
Chuỗi các phần tử |
A.3.5 Hạt nhân biến đổi tùy ý (ATK)
Chức năng Mô tả một hạt nhân biến đổi và một chỉ số cho phép sắp xếp ngói thành phần.
Sử dụng: Hiện tại nếu chỉ khả năng hạt nhân biến đổi tùy ý trong tham số Rsiz (xem A.2.1) là một giá trị. Tiêu đề chính và tiêu đề phần khối ảnh đầu tiên của một ngói nhất định. Có thể tới 254 phân đoạn nhãn trong bất kỳ tiêu đề. Một điểm phân đoạn nhãn trong tiêu đề phần khối ảnh với cùng một chỉ số là một trong tiêu đề chính sẽ ghi đè các tiêu đề chính điểm phân đoạn nhãn.
Length: Thay đổi
Hình A.5 – Cú pháp mặc định biến đổi tùy ý
ATK: Mã đánh dấu. Hình vẽ A.5 Hiển thị kích thước và các giá trị của các biểu tượng và các tham số cho tùy ý Biến đổi phân đoạn nhãn.
Latk: Chiều dài của phân đoạn nhãn theo byte (không bao gồm các điểm đánh dấu). Giá trị của tham số này được xác định bởi phương trình sau đây:
Trong đó kích thướcof(Coeff_Typ) là kích thước (in bytes) của các tham số Satk nó nhận giá trị của loại Coeff_Typ.
Satk: Chỉ số của ATK phân đoạn nhãn; Loại, Coeff_Typ, của hệ số tỉ lệ và các tham số nâng bước; thể loại bộ lọc sóng. Filt_Cat; loại Biến đổi sóng, WT_Typ, ban đầu lẻ hoặc trình tự chẵn, mjnit.
Giá trị “0000 0000” và “0000 0001” không tồn tại đối với chỉ số này được bố trí trong 9-7 bộ lọc sóng không thể thay và 5-3 bộ lọc sóng đảo ngược tương ứng trong ITU-T Rec. T.800 | ISO/IEC 15444-1 Phụ lục A.
Katk: Hệ số tỷ lệ, K. chỉ biểu thị Biến đổi không thể đảo ngược, WT_Typ = IRR.
Natk: Số bước nâng, NLS.
OatkS: Bù đắp cho bước nâng s, offS. Chỉ số, s, khoảng từ s = 0 đến Natk- 1. Chỉ xuất hiện nếu Filt_Cat = ARB.
EatkS: Hai cơ sở mở rộng quy mô số mũ cho bước nâng s, εS. Chỉ xuất hiện với Biến đổi ngược, WT_Typ = REV. chỉ số, s, khoảng từ s = 0 đến Natk- 1.
BatkS: Các dư lượng phụ cho bước nâng, s. chỉ xuất hiện đối với Biến đổi ngược, (WT_Typ = REV). Chỉ số, s, Khoảng từ s = 0 đến Natk – 1.
LCatkS: Số lượng báo hiệu hệ số nâng cho bước nâng s. khoảng, k, đối với AatksK Chỉ số, s, khoảng từ s = 0 đến Natk – 1.
Aatksk: kth hệ số nâng cho bước nâng s, αs,k. Chỉ số, s, khoảng từ s = 0 to Natk – 1. Chỉ số, k, khoảng từ k = 0 đến LCatk – 1.
Bảng A.27 – Các giá trị tham số biến đổi tùy ý
Tham số |
Kích thước (bits) |
Giá trị |
ATK |
16 |
0xFF79 |
Latk |
16 |
9-65 535 |
Satk |
16 |
Bảng A.28 |
Katk |
0 8 16 32 64 128 |
WT_Typ = REV
WT_Typ = IRR, Coeff_Typ = 0 WT_Typ = IRR, Coeff_Typ = 1 WT_Typ = IRR, Coeff_Typ = 2 WT_Typ = IRR, Coeff_Typ = 3 WT_Typ = IRR, Coeff_Typ = 4 |
Natk |
8 |
0-255 |
Oatks |
0 8 |
Filt Cat = WS
-128-127; Filt Cat = ARB |
EatkS |
0 8 |
WT_Typ = IRR
0-255; WT_Typ = REV |
Batks |
0 8 16 32 64 128 |
WT_Typ = IRR
Coeff_Typ = 0 Coeff_Typ = 1 Coeff_Typ = 2 Coeff_Typ = 3 Coeff_Typ = 4 |
LCatks |
8 |
0-255 |
Aatksk |
8 16 32 64 128 |
Coeff_Typ = 0
Coeff_Typ = 1 Coeff_Typ = 2 Coeff_Typ = 3 Coeff_Typ = 4 |
Bảng A.28 – Các giá trị biến đổi tùy ý cho tham số Satk
Giá trị (bits) |
Chỉ số |
|
MSB |
LSB |
|
xxxx xxxx đến xxxx xxxx |
0000 0010 đến 1111 1111 |
Chỉ số của các phân đoạn nhãn (2-255) |
xxxx x000 |
xxxx xxxx |
Tham số 8-bit số nguyên có đánh dấu, Coeff_Typ = 0 |
xxxx x001 |
xxxx xxxx |
Tham số 16-bit số nguyên có đánh dấu, Coeff_Typ = 1 |
xxxx x010 |
xxxx xxxx |
Tham số 32-bit dấu phảy động (IEEE Std. 754-1985 R1990), Coeff_Typ = 2 |
xxxx x011 |
xxxx xxxx |
Tham số 64-bit dấu phảy động (IEEE Std. 754-1985 R1990), Coef_Typ = 3 |
xxxx x100 |
xxxx xxxx |
Tham số 128-bit dấu phảy động (IEEE Std. 754-1985 R1990), Coeff_Typ = 4 |
xxxx 0xxx |
xxxx xxxx |
Bộ lọc tùy ý, Filt_Cat = ARB |
x1xx 1xxx |
xxxx xxxx |
Các bộ lọc WS, Filt_Cat = WS |
xxx0 xxxx |
xxxx xxxx |
Bộ lọc không thuận nghịch, WT_Typ = IRR |
xxx1 xxxx |
xxxx xxxx |
Bọc lọc thuận nghịch, WT_Typ = REV |
xx0x xxxx xx1x xxxx |
xxxx xxxx xxxx xxxx |
Sửa đổi dãy chỉ mục chẵn trong cơ cấu lại bước đầu tiên, minit = 0
Sửa đổi dãy chỉ mục lẻ trong cơ cấu lại bước đầu tiên, minit = 1 |
x0xx 0xxx |
xxxx xxxx |
Phương pháp mở rộng ranh giới được sử dụng trong việc nâng bước là hằng số, Exten = CON |
x1xx xxxx |
xxxx xxxx |
Phương pháp mở rộng ranh giới được sử dụng trong việc nâng bước là toàn bộ-mẫu đối xứng, Exten = WS |
|
|
Tất cả các giá trị khác được dành riêng |
A.3.6 Xác định độ sâu bit thành phần (CBD)
Chức năng: Xác định độ sâu bit của thành phần ảnh dựng lại ra khỏi tùy ý quá trình Biến đổi nhiều thành phần.
Sử dụng: Hiện tại nếu chỉ nhiều khả năng thành phần Biến đổi bit trong tham số Rsiz (xem A.2.1) là một giá trị. Tiêu đề chính. Đoạn đánh dấu CBD là bắt buộc nếu trình Biến đổi nhiều thành phần được sử dụng. Tối đa có thể có một CBD trong tiêu đề chính.
Sự hiện diện của một phân đoạn nhãn CBD trong một dòng mã làm thay đổi các thủ tục được sử dụng để xác định độ chính xác của ảnh thành phần đầu ra và giải thích của đánh dấu SIZ. Hãy xem phụ lục J cho biết thêm chi tiết.
Chiều dài: Thay đổi tùy thuộc vào số lượng bit độ sâu thành phần ảnh dựng được báo hiệu
Hình A.6 – Cú pháp xác định độ sâu bit thành phần
CBD: Mã đánh dấu. Bảng A.29 Hiển thị các giá trị kích thước và tham số cho cú pháp định nghĩa chiều sâu bit thành phần
Lcbd: Chiều dài của phân đoạn nhãn theo byte (không bao gồm các điểm đánh dấu). Giá trị của tham số này được xác định bởi phương trình sau đây:
Ncbd: Số lượng của độ sâu bit thành phần bao gồm trong phân đoạn nhãn. Bảng A.30 Hiển thị giá trị cho tham số Ncbd.
BDcbdi: Độ sâu bit và dấu của các thành phần ảnh tái tạo theo thứ tự mà trong đó chúng được tạo được xác định bởi các MCC và MCO phân đoạn nhãn. Hoặc là một giá trị báo hiệu cho tất cả các thành phần (xem bảng A.30) hoặc mỗi bit độ sâu được đưa ra cho mỗi thành phần.
Bảng A.29- các giá trị tham số định nghĩa độ sâu bit thành phần
Tham số |
Kích cỡ (bits) |
Giá trị |
CBD |
16 |
0xFF78 |
Lcbd |
16 |
5-16 388 |
Ncbd |
16 |
Bảng A.30 |
BDcbdi |
8 |
Bảng A.31 |
Bảng A.30- các giá trị định nghĩa độ sâu bit thành phần đối với tham số Ncbd
Giá trị (bits) |
Nhãn số độ sâu bit thành phần ảnh phục chế |
|
MSB |
LSB |
|
x000 0000 |
0000 0001 |
|
đến |
đến |
Số lượng các thành phần ảnh tái tạo (1-16 384) |
x100 0000 |
0000 0000 |
|
0xxx xxxx |
xxxx xxxx |
Độ sâu bit bao gồm, mỗi chuỗi thành phần ảnh tái tạo một bit độ sâu bao gồm, áp dụng cho tất cả các thành phần ảnh tái tạo |
1xxx xxxx |
xxxx xxxx |
|
|
|
Tất cả các giá trị khác được dành riêng |
Bảng A.31 – Các giá trị xác định độ sâu bit thành phần đối với tham số BDcbdi
Giá trị (bits) |
Độ sâu bit thành phần ảnh phục chế |
|
MSB |
LSB |
|
x000 đến x010 |
0000 đến 0101 |
Độ sâu bit mẫu thành phần = giá trị + 1. Từ 1 bit độ sâu đến 38 bits độ sâu tương ứng. |
0xxx |
xxxx |
Thành phần mẫu giá trị là giá trị không dấu |
1xxx |
xxxx |
Thành phần mẫu giá trị là giá trị có dấu |
|
|
Tất cả các giá trị khác được dành riêng |
A.3.7 Xác định biến đổi nhiều thành phần (MCT)
Chức năng: Xác định một trong ma trận Biến đổi nhiều thành phần đối với một phân đoạn nhãn . Các loại và các chỉ số của các ma trận quy định tại đánh dấu phân biệt nó từ MCT phân đoạn nhãn khác trong một tiêu đề nhất định. Ma trận này có thể được xác định để một tập hợp các thành phần trong phân khúc đánh dấu MCC.
Sử dụng: Hiện tại nếu chỉ bit có khả năng biến đổi nhiều thành phần trong tham số Rsiz (xem A.2.1) là một giá trị. Tiêu đề chính và tiêu đề phần khối ảnh đầu tiên của một khối ảnh đã cho. Một đoạn nhãn MCT trong tiêu đề phần khối ảnh là quan trọng hơn đoạn MCT tiêu đề chính đối với khối ảnh đó nếu và chỉ nếu nhận dạng được 10 bit bậc thấp của các trường Imct của cả hai đoạn nhãn.
Một loạt các phân đoạn nhãn MCT (được xác định là có cùng một giá trị Imct trong cùng một tiêu đề và một Ymct > 0) sẽ xuất hiện trong tiêu đề tương tự trong thứ tự của các giá trị tham số Zmct (liên tiếp).
Để áp dụng các ma trận Biến đổi bao gồm trong một phân đoạn nhãn MCT, một phân đoạn nhãn MCC phải tồn tại rằng phân đoạn nhãn MCT tương ứng với một tập hợp thành phần.
Kết hợp này được thực hiện thông qua chỉ số định nghĩa ma trận của đoạn đánh dấu MCT và các trường Tmcci của phân đoạn nhãn MCC. Nếu không có phân đoạn nhãn MCC như vậy tồn tại, sau đó các ma trận Biến đổi bao gồm trong phân đoạn nhãn MCT sẽ không được sử dụng trong quá trình giải mã.
Length: Biến tùy thuộc vào kích thước của các ma trận.
Hình A.7 – Cú pháp xác định biến đổi nhiều thành phần
MCT: Mã đánh dấu. Bảng A.32 Hiển thị các giá trị kích thước và tham số cho nhiều định nghĩa Biến đổi thành phần của phân đoạn nhãn.
Lmct: Chiều dài của phân đoạn nhãn theo byte (không bao gồm các đánh dấu).
Zmct: Chỉ số của phân đoạn nhãn này trong một loạt các phân đoạn nhãn MCT. Tất cả các phân đoạn nhãn trong bộ này có cùng một Imct tham số giá trị hiện diện trong tiêu đề này. Các dữ liệu trong mỗi phân khúc đánh dấu MCT tiếp theo sẽ được nối thêm, theo thứ tự, để thực hiện trên giá trị tham số dòng SPmcti. Các giá trị tham số Ymct là hiện nay chỉ trong các phân đoạn nhãn đầu tiên trong bộ này (Zmct = 0).
Imct: Giá trị chỉ số biến đổi nhiều thành phần, dạng ma trận và tham số kích cỡ. Đoạn nhãn MCT hoặc chuỗi, với một giá trị Imct đã cho trong tiêu đề phần khối ảnh là quan trọng hơn một đoạn nhãn MCT tiêu đề chính, hoặc chuỗi, nếu và chỉ nếu nhận dạng được 10 bit bậc thấp (chỉ số và dạng biến đổi) của các giá trị Imct của cả hai nhãn.
Nhiều chỉ số chuyển đổi thành phần, loại mảng và kích thước tham số. Một phân đoạn hoặc chuỗi MCT với một giá trị Imct cho tiêu đề ngói-một phần ghi đè lên phần đầu tiêu đề chính của MCT, hoặc chuỗi, nếu và chỉ khi mười bit lệnh thấp (chỉ số và loại chuyển đổi) của Imct giá trị của cả hai đánh dấu là giống hệt nhau.
Ymct: Chỉ số của số cuối cùng của phân đoạn nhãn MCT trong bộ này. Đối với mỗi loạt phân đoạn nhãn MCT (tức là, MCT phân đoạn nhãn trong tiêu đề này với cùng giá trị tham số Imct), sẽ có phân đoạn nhãn MCT với giá trị tham số Zmct của 0 đến Ymct. Phân đoạn cuối đánh dấu MCT sẽ có Zmct = Ymct. Giá trị này hiện nay chỉ trong các phân đoạn nhãn đầu tiên trong bộ này (Zmct = 0).
SPmcti: Tham số để định nghĩa Biến đổi nhiều thành phần. Một giá trị tham số cho mỗi phần tử trong ma trận. Xem J.2 để xác định số lượng các phần tử ma trận và trật tự trong phân đoạn nhãn. Số lượng các phần tử trong một hàng và số lượng hàng (các thành phần trong một cột) được xác định bởi loại ma trận và số lượng đầu vào và đầu ra các thành phần mà nó được gán.
Bảng A.32 – Các giá trị tham số xác định biến đổi nhiều thành phần
Tham số |
Kích thước (bits) |
Giá trị |
MCT |
16 |
0xFF74 |
Lmct |
16 |
6-65 535 |
Zmct |
16 |
0-65 535 |
Imct |
16 |
Bảng A.33 |
Ymct |
0 |
Nếu Zmct > 0 |
16 |
0-65 535 |
|
SPmcti |
Biến đổi |
Biến thiên, ma trận các dạng như chỉ ra trong Bảng A.33 |
Bảng A.33 – Các giá trị xác định biến đổi nhiều thành phần đối với tham số Imct
Giá trị (bits) |
Chỉ số xác định ma trận, loại và loại tham số |
|
MSB |
LSB |
|
xxxx xxxx đến xxxx xxxx |
0000 0001 đến 1111 1111 |
Chỉ số của định nghĩa ma trận, 1-255 |
xxxx xx00 |
xxxx xxxx |
Loại ma trận biến đổi phụ thuộc |
xxxx xx01 |
xxxx xxxx |
Loại ma trận biến đổi không tương quan |
xxxx xx10 |
xxxx xxxx |
Loại ma trận độ lệch |
xxxx 00xx |
xxxx xxxx |
Ma trận các phần tử 16 bit số nguyên có đánh dấu |
xxxx 01xx |
xxxx xxxx |
Ma trận các phần tử 32 bit số nguyên có đánh dấu |
xxxx 10xx |
xxxx xxxx |
Ma trận các phần tử 32 bit số có dấu phẩy động (IEEE Std. 754-1985 R1990) |
xxxx 11xx |
xxxx xxxx |
Ma trận các phần tử 64 bit số có dấu phẩy động (IEEE Std. 754-1985 R1990) |
|
|
Tất cả các giá trị khác được dành riêng |
A.3.8 Tập hợp biến đổi nhiều thành phần (MCC)
Chức năng: Mô tả tập hợp của các thành phần đầu vào trung gian. Tập hợp các thành phần đầu ra trung gian, và liên kết sóng hay ma trận đối với biến đổi thành phần nhiều. Phân đoạn nhãn này có thể xuất hiện trong tiêu đề chính và có thể được gọi hoặc ghi đè bởi một đánh dấu MCC trong một tiêu đề phần khối ảnh
Sử dụng: Hiện tại nếu chỉ bit khả năng Biến đổi nhiều thành phần trong tham số Rsiz (xem A.2.1) là một giá trị. Tiêu đề chính và tiêu đề phần khối ảnh đầu tiên của một ngói nhất định. Có thể có đến 255 MCC phân đoạn nhãn, hoặc loạt các phân đoạn nhãn, trong tiêu đề chính. Có thể có đến 255 MCC phân đoạn nhãn, hoặc loạt các phân đoạn nhãn, trong tùy ý tiêu đề phần ngói. Một phân đoạn nhãn MCC trong một tiêu đề phần khối ảnh với cùng một chỉ số (Imcc) là một trong tiêu đề chính sẽ ghi đè các phân đoạn MCC tiêu đề chính cho ngói đó. Một loạt các MCC phân đoạn nhãn (được xác định là có cùng một giá trị Imcc trong cùng một tiêu đề và một Ymcc > 0) sẽ xuất hiện trong tiêu đề tương tự trong thứ tự của các giá trị tham số Zmcc (liên tiếp).
Length: Biến tùy thuộc vào số lượng các tập hợp thành phần.
Hình A.8 – Cú pháp tập hợp nhiều thành phần
MCC: Đánh dấu mã. Bảng A.34 Hiển thị các giá trị kích thước và tham số cho phân đoạn đánh
dấu nhiều thành phần tổng hợp.
Lmcc: Chiều dài của phân đoạn nhãn theo byte (không bao gồm các đánh dấu).
Zmcc: Chỉ số của phân đoạn nhãn trong một loạt các phân đoạn nhãn MCC. Tất cả các phân đoạn nhãn trong bộ này có cùng một Imcc tham số giá trị hiện diện trong tiêu đề này. Các dữ liệu trong mỗi phân đoạn nhãn MCC tiếp theo sẽ được nối thêm, theo thứ tự, để làm cho dòng các thông số khác. Các tham số Ymcc và Qmcc xuất hiện chỉ trong đoạn đánh dấu đầu tiên (Zmcc = 0).
Imcc: Chỉ số phân đoạn nhãn. Một phân đoạn nhãn MCC, hoặc chuỗi s, với một giá trị Imcc nhất định trong tiêu đề phần khối ảnh sẽ thay thế một tiêu đề chính phân đoạn nhãn MCC, hoặc chuỗi, với cùng một giá trị Imcc.
Ymcc: Chỉ số của số cuối cùng của phân đoạn nhãn MCC trong bộ này. Đối với mỗi loạt các phân đoạn nhãn MCC (tức là MCC phân đoạn nhãn trong tiêu đề này với cùng giá trị tham số Imcc), sẽ có phân đoạn nhãn MCC với giá trị tham số Zmcc của 0 đến Ymcc. Phân đoạn nhãn cuối MCC sẽ có Zmcc = Ymcc. Giá trị này xuất hiện chỉ trong các phân đoạn nhãn đầu tiên trong bộ này (Zmcc = 0).
Qmcc: Số lượng các tập hợp trong phân đoạn nhãn MCC. Giá trị này xuất hiện chỉ trong các phân đoạn nhãn đầu tiên trong bộ này (Zmcc = 0).
Xmcci: Chỉ ra loại biến đổi nhiều thành phần được sử dụng cho tập hợp thành phần thứ i (sóng hoặc dựa trên không ma trận tương quan hoặc dựa trên ma trận phụ thuộc). Xác định giải thích được áp dụng cho Tmcc.
Nmcci: Chỉ ra số lượng các thành phần đầu vào cho tập hợp thành phần thứ i và xác định số bit (8 hoặc 16) được sử dụng để đại diện cho chỉ số thành phần trong tập hợp tập hợp thứ i.
Cmccij: Chỉ số đầu vào thành phần trung gian bao gồm các tập hợp thành phần thứ i. Số lượng các chỉ số trong tập hợp thành phần thứ i là Nmcci. Mỗi chỉ số biểu thị một thành phần trung gian đầu vào. Thứ tự của các chỉ số xác định thứ tự áp dụng cho các thành phần trung gian nhập trước khi áp dụng các biến đổi hướng ngược.
Mmcci: Chỉ ra số lượng các thành phần trung gian đầu ra cho tập hợp thành phần thứ i và xác định số bit (8 hoặc 16) được sử dụng để đại diện cho chỉ số thành phần trong tập hợp thứ i. Nếu bất cứ điều gì khác so với không tương quan thay đổi dựa trên ma trận biến đổi được sử dụng, Mmcci phải bằng Nmcci.
Wmccij: Chỉ số thành phần trung gian bao gồm tập hợp thành phần đầu ra thứ i. Số lượng các chỉ số trong tập hợp thành phần thứ i là Mmcci. Tất cả các chỉ số thành phần trung gian trong một phân đoạn nhất định đánh dấu MCC sẽ xuất hiện chỉ một lần cho tất cả các tập hợp trong đánh dấu MCC đó.
Tmcci: Đối với các ma trận dựa trên biến đổi tập hợp thành phần, Tmcci gán ma trận được xác định trong một phân đoạn nhãn MCT vào bộ tập hợp thành phần thứ i. Một phân đoạn nhãn MCT với đúng loại và các chỉ số trong tiêu đề ngói -một phần đầu tiên của một ngói được sử dụng trước khi một phân đoạn nhãn MCT với đúng loại và các chỉ số trong tiêu đề chính. Tmcci cũng cho biết r thành phần dựa trên ma trận biến đổi ngược.
Đối với các biến đổi tập hợp dựa trên sóng thành phần, Tmcci đặt một hạt nhân sóng được định nghĩa trong ITU T Rec T.800 | Tiêu chuẩn ISO/IEC 15444-1 phụ lục A hoặc một ATK phân đoạn nhãn và số lượng sóng phân rã cấp cho tập hợp thành phần thứ i (chỉ là sự phân rã dyadic của ITU-T Rec T.800 | ISO/IEC 15444-1 được hỗ trợ). Một phân đoạn nhãn ATK với mục thích hợp trong tiêu đề ngói – phần đầu tiên của một ngói được sử dụng trước khi một phân đoạn nhãn ATK với mục thích hợp trong tiêu đề chính. Tmcci cũng chứa chỉ số của một phân đoạn nhãn MCT có chứa thành phần phụ độ lệch s.
Omcci: Chỉ xuất hiện trong đoạn đánh dấu MCC cho những tập hợp thành phần mà sử dụng một biến đổi dựa trên sóng. Omcci cho biết lưới tham khảo được bù đắp để áp dụng trong thành phần kích thước cho tập hợp thành phần thứ i (xem J.2.2).
Bảng A.34 – Các giá trị tham số tập hợp nhiều thành phần
Tham số |
Kích thước (bits) |
Giá trị |
MCC |
16 |
0xFF75 |
Lmcc |
16 |
5-65 535 |
Zmcc |
16 |
0-65 535 |
Imcc |
8 |
0-255 |
Ymcc |
0 |
Nếu Zmcc > 0 |
|
16 |
0-65 535 |
Qmcc |
0 |
Nếu Zmcc > 0 |
|
16 |
0-16 383 |
Xmci |
8 |
Bảng A.35 |
Nmcci |
16 |
Bảng A.36 |
Cmccij |
8 |
0-255 |
|
16 |
0-16 383 |
Mmcci |
16 |
Bảng A.37 |
Wmccij |
8 |
0-255 |
|
16 |
0-16 383 |
Tmcci |
24 |
Bảng A.38 hoặc Bảng A.39 |
Omcci |
32 |
0-4 294 967 295 |
Bảng A.35 – Các giá trị tập hợp nhiều thành phần đối với tham số Xmcci
Giá trị (bits) |
Dạng mã hóa |
Tham số Tmcci |
|
MSB |
LSB |
||
xxxx |
xx00 |
Biến đổi tập hợp thành phần là biến đổi dựa trên ma trận phụ thuộc |
Bảng A.38 |
xxxx |
xx01 |
Biến đổi tập hợp thành phần là biến đổi dựa trên ma trận không tương quan |
Bảng A.38 |
xxxx |
xx11 |
Biến đổi tập hợp thành phần là Biến đổi Sóng |
Bảng A.39 |
|
|
Tất cả các giá trị khác được dành riêng |
|
Bảng A.36- Các giá trị tập hợp nhiều thành phần đối với tham số Nmcci
Giá trị (bits) |
Dạng mã hóa |
|
MSB |
LSB |
|
0xxx xxxx |
xxxx xxxx |
Các chỉ số tập hợp thành phần đầu vào (Cmcci) là 8 bit số nguyên |
đến |
đến |
|
1xxx xxxx |
xxxx xxxx |
Các chỉ số tập hợp thành phần đầu vào (Cmcci) là 16 bit số nguyên |
x000 0000 đến x100 0000 |
0000 0001 đến 0000 0000 |
Số lượng các thành phần đầu vào trong tập hợp thành phần thứ i (1-16 384) |
Bảng A.37-Các giá trị tập hợp nhiều thành phần đối với tham số Mmcci
Giá trị (bits) |
Dạng mã hóa |
|
MSB |
LSB |
|
0xxx xxxx |
xxxx xxxx |
Các chỉ số tập hợp đều ra thành phần (Wmcci) là 8 bit số nguyên |
đến |
đến |
|
1xxx xxxx |
xxxx xxxx |
Các chỉ số tập hợp đầu ra thành phần (VVmcci) là 16 bit số nguyên |
x000 0000 |
0000 0001 |
Số lượng các thành phần đầu vào trong tập hợp thành phần thứ i (1-16 384) |
đến |
đến |
|
x100 0000 |
0000 0000 |
Bảng A.38 – Các giá trị tập hợp nhiều thành phần đối với tham số Tmcci (ma trận cơ sở)
Giá trị (bits) |
Dạng mã hóa |
|
MSB |
LQR |
|
xxxx xxxx xxxx xxxx xxxx xxxx đến xxxx xxxx xxxx |
xxxx 0000 0000 xxxx 0000 000x đến xxxx 1111 1111 |
Ma trận biến đổi không được ấn định (ma trận NULL)
Chỉ số ma trận biến đổi không tương quan hoặc phụ thuộc |
xxxx xxxx 0000 xxxx xxxx 0000 đến xxxx xxxx 1111 |
0000 xxxx xxxx 0001 xxxx xxxx đến 1111 xxxx xxxx |
Ma trận độ lệch không được ấn định (ma trận NULL)
Chỉ số ma trận độ lệch |
xxxx xxx0 xxxx xxxx xxx1 xxxx |
xxxx xxxx xxxx xxxx xxxx xxxx |
Biến đổi không tương quan hoặc phụ thuộc không thuận nghịch
Biến đổi không tương quan hoặc phụ thuộc thuận nghịch |
|
|
Tất cả các giá trị khác được dành riêng |
Bảng A.39 – Các giá trị tập hợp nhiều thành phần đối với tham số Tmcci (sóng con cơ sở)
Giá trị (bits) |
Dạng mã hóa |
|
MSB |
LSB |
|
xxxx xxxx xxxx xxxx xxxx xxxx |
xxxx 0000 0000 xxxx 0000 0001 |
ITU-T Rec. T.800 | ISO/IEC 15444-1 9-7 lọc không thuận nghịch |
xxxx xxxx xxxx |
xxxx 0000 0010 |
ITU-T Rec. T.800 | ISO/IEC 15444-1 5-3 lọc thuận nghịch |
đến xxxx xxxx xxxx |
đến xxxx1111 1111 |
Chỉ số đoạn nhãn ATK có chứa lõi sóng con đối với tập hợp thành phần |
xxxx xxxx 0000 xxxx xxxx 1111 |
0000 xxxx xxxx 1111 xxxx xxxx |
Chỉ số phân đoạn nhãn MCT có chứa độ lệch s phụ cho tập hợp thành phần |
xx00 0000 xxxx xx10 0000 xxxx |
xxxx xxxx xxxx xxxx xxxx xxxx |
Số lượng mức độ phân rã nhị phân sóng được sử dụng trong tập hợp thành phần (0-32) |
|
|
Tất cả các giá trị khác được dành riêng |
A.3.9 Thứ tự biến đổi nhiều thành phần (MCO)
Chức năng: Mô tả thứ tự trong đó biến đổi nhiều thành phần được áp dụng trong tiến trình Biến đổi nhiều thành phần hướng ngược.
Sử dụng: Hiện tại nếu chỉ bit khả năng biến đổi nhiều thành phần trong tham số Rsiz (xem A.2.1) là một giá trị. Tối đa một phân đoạn nhãn MCO trong tiêu đề chính và đầu tiên tiêu đề ngói -một phần của ngói nhất định. Nếu được sử dụng trong tiêu đề chính, phân đoạn nhãn này xác định thứ tự mặc định của nhiều thành phần giai đoạn Biến đổi cho tất cả các ngói. Nếu được sử dụng trong tiêu đề phần khối ảnh đầu tiên, sau đó bộ biến đổi thành phần được thành lập bởi các phân đoạn nhãn MCO ghi đè lên tùy ý thứ tự mặc định được xác định bởi một chính tiêu đề phân đoạn nhãn MCO.
Chiều dài: Thay đổi tùy thuộc vào số lượng các giai đoạn Biến đổi nhiều thành phần được sử dụng
Hình A.9 – Cú pháp thứ tự biến đổi nhiều thành phần
MCO: Mã đánh dấu. Bảng A.40 Hiển thị các giá trị kích thước và tham số đối với biến đổi nhiều
thành phần thứ tự phân đoạn nhãn.
Lmco: Chiều dài của phân đoạn nhãn theo byte (không bao gồm các đánh dấu). Chiều dài được đưa ra bởi các biểu thức sau:
Lmco = 3 + Nmco (A-6)
Nmco: Số lượng các giai đoạn Biến đổi nhiều thành phần được chỉ định để xử lý biến đổi hướng ngược. Nếu Nmco = 0, thì không có nhiều Biến đổi thành phần xử lý được sử dụng cho tiel hiện tại và không có tham số Imcoi nào sẽ xuất hiện. Nếu không, Nmco chỉ định số định danh MCC phân đoạn nhãn sẽ làm theo.
Imcoi: Các chỉ số của phân đoạn nhãn MCC có chứa các thành phần tập hợp thông tin cho hướng ngược giai đoạn biến đổi nhiều thành phần thứ I (xem A.3.8).
Bảng A.40 – Các giá trị tham số tập hợp trung gian nhiều thành phần
Tham số |
Kích thước (bits) |
Giá trị |
MCO |
16 |
0xFF77 |
Lmco |
16 |
3-258 |
Nmco |
8 |
0-255 |
Imcoi |
8 |
0-255 |
A.3.10 Biến đổi điểm phi tuyến (NLT)
Chức năng: Mô tả gamma hoặc LUT không tuyến tính được áp dụng cho một thành phần duy nhất hoặc tất cả các thành phần.
Sử dụng: Chỉ xuất hiện nếu bit khả năng biến đổi -không tuyến tính trong tham số Rsiz (xem A.2.1) là một giá trị. Tiêu đề chính và đầu tiên ngói -phần tiêu đề của một ngói nhất định. Có thể có không nhiều hơn một phân đoạn nhãn thành phần cộng với một mặc định trong tùy ý tiêu đề. Khi được sử dụng trong tiêu đề chính, không tính tuyến tính được xác định có thể được thành lập như là một mặc định cho tất cả các thành phần hoặc thành lập như là một mặc định cho một thành phần duy nhất. Khi sử dụng một tiêu đề phần ngói, nó có thể được sử dụng để thiết lập mặc định cho tất cả các thành phần trong ngói hoặc để thiết lập sự Biến đổi không tuyến tính cho một thành phần duy nhất trong ngói đó. Vì vậy, thứ tự ưu tiên là như sau:
Phần khối ảnh NLT > Phần khối ảnh NLT ngầm định > NLT Chính > NLT chính ngầm định Trong đó “dấu lớn hơn” >, có nghĩa là các giá trị lớn hơn ghi đè các giá trị phân đoạn nhỏ hơn.
Length: Thay đổi phục thuộc vào giá trị của Tnlt.
Hình A.10 – Cú pháp biến đổi điểm phi tuyến
NLT: Mã đánh dấu. Bảng A.41 Hiển thị kích thước và các giá trị của các biểu tượng và các tham số cho phân đoạn nhãn Biến đổi không tuyến tính.
Lnlt: Chiều dài của phân đoạn nhãn theo byte (không bao gồm các đánh dấu). Giá trị của tham số này được xác định bởi phương trình sau đây:
Chú thích – Đặc tả biến đổi phi tuyến với Tnlt = 0 cho phép ngăn chặn dứt khoát sự biến đổi.
Cnlt: Chỉ số của các thành phần mà phân đoạn nhãn liên quan. Các thành phần là các chỉ mục 0, 1, 2, vv. Nếu giá trị này là 65 535, sau đó phân đoạn nhãn này áp dụng cho tất cả các thành phần. Bảng A.42 Hiển thị giá trị cho tham số Cnlt.
BDnlt: Độ sâu bit và dấu của các thành phần ảnh giải mã, Zi, sau khi xử lý thứ tự l thành phần ảnh tái tạo bởi không tuyến tính. Nếu Cnlt = 65 535, sau đó giá trị này áp dụng cho tất cả các thành phần. Bảng A.43 Hiển thị các giá trị cho tham số BDnlt.
Tnlt: Loại không tuyến tính. Bảng A.44 Hiển thị giá trị cho tham số Scod.
STnlt: Giá trị tham số kết hợp với không tuyến tính như kiểm soát bởi trường Tnlt.
Bảng A.41 – Các giá trị tham số biến đổi phi tuyến
Tham số |
Kích thước (bits) |
Giá trị |
NLT |
16 |
0xFF76 |
Lnlt |
16 |
12-65 535 |
Cnlt |
16 |
Bảng A.42 |
BDnlt |
8 |
Bảng A.43 |
Tnlt |
8 |
Bảng A.44 |
STnlt |
Biến đổi |
Bảng A.44 |
Bảng A.42 – Các giá trị tham số biến đổi phi tuyến đối với tham số Cnlt
Giá trị |
Các thành phần tham số chỉ số |
0-16 383 |
Xác định thành phần để áp dụng những mô tả Biến đổi không tuyến tính y trong phân đoạn nhãn này |
65 535 |
Mô tả Biến đổi không tuyến tính trong phân đoạn đánh dấu này áp dụng cho tất cả các thành phần |
|
Tất cả các giá trị khác được dành riêng |
Bảng A.43 – Các giá trị tham số độ sâu bit thành phần ảnh được giải mã đối với tham số BDnlt
Giá trị (bits) |
Độ sâu bit thành phần ảnh được giải mã |
|
MSB |
LSB |
|
x0000 đến x010 |
0000 đến 0101 |
Độ sâu bit mẫu thành phần = giá trị + 1. Từ 1 bit sâu đến 38 bits tương ứng |
0xxx |
xxxx |
Giá trị mẫu thành phần là giá trị không dấu |
1xxx |
xxxx |
Giá trị mẫu thành phần là giá trị có dấu |
|
|
Tất cả các giá trị khác được dành riêng |
Bảng A.44 – Các giá trị tham số biến đổi phi tuyến của tham số Tnlt
Giá trị (bits) |
Độ sâu bit thành phần ảnh được giải mã |
|
MSB |
LSB |
|
0000 |
0000 |
Không có biến đổi phi tuyến được áp dụng |
0000 |
0001 |
Kiểu biến đổi phi tuyến hệ số ảnh |
0000 |
0010 |
4.4 Kiểu biến đổi phi tuyến LUT |
|
|
4.5 Tất cả các giá trị khác được dành riêng |
Bảng A.45 – Các giá trị tham số biến đổi phi tuyến của tham số STnlt (Tnlt = 1)
Tham số (theo thứ tự) |
Kích thước (bits) |
Giá trị |
Ý nghĩa của giá trị STnlt |
E |
24 |
|
Số mũ không tuyến tính (8-bit số nguyên + một phần 16-bit) |
S |
24 |
|
Sườn không tuyến tính (8-bit số nguyên + một phần 16-bit) |
T |
24 |
|
Ngưỡng giới hạn không tuyến tính 8-bit số nguyên + một phần 16-bit) |
A |
24 |
|
Tham số liên tục không tuyến tính A (8-bit số nguyên + một phần 16-bit) |
B |
24 |
|
Tham số không tuyến tính B (8-bit số nguyên + một phần 16-bit) |
Chú thích – Các tham số E, S và A phải khác 0 vì biến đổi phi tuyến được xác định bởi công thức (K-2) không trái với định nghĩa đúng.
Bảng A.46 – Các giá trị tham số biến đổi phi tuyến của tham số STnlt (Tnlt = 2)
Tham số (theo thứ tự) |
Kích thước (bits) |
Giá trị |
Ý nghĩa của giá trị STnlt |
Npoints |
16 |
1-8 191 |
(Số điểm – 1) trong kiểu định nghĩa không tuyến tính LUTn (Tất cả các giá trị khác dự phòng) |
Dmin |
32 |
0-(232-1) |
Dmin = Giá trị tham số / (232-1) |
Dmax |
32 |
1-(232-1) |
Dmax = Giá trị tham số / (232-1) |
PTval |
8 |
0000 0001 to 0010 0000 |
Độ chính xác của giá trị T dưới dạng bits (1-32). Điều này cũng định nói bao nhiêu byte được dùng để biểu diễn giá trị T (Tất cả các giá trị khác dự phòng) |
T giá trị |
8, PTval ≤ 8; 16, 9 ≤ PTval ≤ 16 32, PTval > 16 |
Biến đổi |
Thực hiện bảng giá trị cho kiểu LUT không tuyến tính. Tham số (Npoints + 1) là giá trị số nguyên không dấu. Giá trị thực của T là Tgiá trị = Giá trị tham tham số /(2PTval-1) |
A.3.11 Lượng tử hóa mặc định, khu vực (QPD)
Chức năng: Mô tả sự lượng tử hóa mặc định được sử dụng để nén tất cả các thành phần mức độ phân giải cụ thể và Khu vực. Các giá trị tham số có thể được ghi đè một thành phần riêng lẻ, cấp độ phân giải và khu vực bởi một phân đoạn QPC đánh dấu đó, nếu có, phải xuất hiện trong một tiêu đề phần khối ảnh trước khi gói tùy ý cho thành phần đó, cấp độ phân giải, và Khu vực.
Cách dùng: Tiêu đề chính và tiêu đề phần khối ảnh tùy ý. Một số phân đoạn nhãn QPD có thể xuất hiện trong tùy ý tiêu đề phần khối ảnh nào, nhưng chỉ có một cho mỗi cấp độ phân giải và Khu vực. Nếu QPD một được sử dụng trong một tiêu đề phần ngói, nó sẽ thay thế các đặc tính lượng tử hóa xác định bởi QCD hoặc phân đoạn nhãn QCC cho tất cả các cấp độ phân giải thành phần và Phần chỉ mục của QPD trong phạm vi của ngói cụ thể. Vì vậy, các đặc tính lượng tử hóa của một mức độ phân giải cụ thể, cặp khu vực được xác định bởi sự hiện diện của các dấu hiệu QCD, QCC, QPD hoặc QPC theo thứ tự sau ưu tiên:
Phần khối ảnh QPC bất kỳ > phần khối ảnh QPD bất kỳ > phần khối ảnh QCC đầu tiên > phần khối ảnh QCD đầu tiên > QPC Cơ bản > QPD Cơ bản > QCC Cơ bản > QCD Cơ bản
Trong đó phân đoạn nhãn QPD được sử dụng, Chúng phải xuất hiện trong tiêu đề phần khối ảnh trước bất kỳ gói tin được xác định để đánh chỉ mục mức độ phân giải và khu vực .
Chiều dài: Thay đổi tùy thuộc vào số lượng tử hóa băng phụ trong chỉ mục mức độ phân giải.
Hình A. 11 – Lượng tử hóa mặc định, cú pháp khu vực
QPD: Mã đánh dấu. Bảng A.47 Hiển thị kích thước và các giá trị của các biểu tượng và các tham số để mặc định sự lượng tử hóa, phân đoạn nhãn khu vực.
Lqpd: Chiều dài của phân đoạn nhãn theo byte (không bao gồm các điểm đánh dấu). Giá trị của tham số này được xác định bởi phương trình sau đây:
Trong đó num_sub-bVÀs_lev có thể được lấy từ F.2.4 đối với mỗi mức độ phân giải và mặc dù phân đoạn nhãn này có no_quant, quant_derived, và quant_expounded được xác định trong tham số Sqpd.
Lưu ý- Lqcd có thể được sử dụng để xác định có bao nhiêu kích thước bước lượng tử hóa xuất hiện trong phân đoạn nhãn. Tuy nhiên, không phải nhất thiết phải một sự tương ứng với số băng phụ bởi các băng phụ có thể được cắt ngắn không có yêu cầu để sửa chữa phân khúc đánh dấu này.
PLqpd: Các chỉ số cấp độ phân giải cho báo hiệu các giá trị sự lượng tử hóa. Phương trình A-9 cho thấy làm thế nào phân đoạn nhãn này được xây dựng dựa trên các chỉ số cấp độ phân giải, lev, cũng như các chỉ số khu vực, prec
Chỉ số cấp độ phân giải, lev, có phạm vi từ 0 đến NL, trong đó NL là số mức phân rã được định nghĩa trong phân ITU-T Rec. T.800 | ISO/IEC 15444-1, A.6.1.
PPqpd: Các chỉ số khu vực cho báo hiệu các giá trị lượng tử hóa. Kích thước của tham số phân đoạn nhãn này sẽ là một byte khi tham số PLqpd ít hơn 128, nhưng hai byte khi PLqpd lớn hơn hoặc bằng 128. Tham số này sau đó chỉ cần giữ chỉ mục khu vực, prec. Chỉ số khu vực, prec, có thể nằm trong khoảng từ 0 đến numprecincts -1, trong đó numprecincts là số khu vực tại cấp độ phân giải lev và cũng được định nghĩa trong Khuyến nghị T800 của ITU| Tiêu chuẩn ISO/IEC 15444-1, B.6.
Sqpd: Kiểu lượng tử hóa cho tất cả các thành phần ở cấp độ phân giải, lev, và khu vực, prec
SPqpdi: Giá trị kích thước bước lượng tử hóa cho ban băng thứ i ở mức độ phân giải, lev, theo thứ tự định nghĩa cho lev trong F.2.4. Số lượng tham số là số lớn tối thiểu như số băng phụ trong phần khối ảnh với số lượng lớn nhất của băng phụ ở cấp độ phân giải, lev
Bảng A.47 – Các giá trị tham số lượng tử hóa mặc định và khu vực
Tham số |
Kích thước (bits) |
Giá trị |
QPD |
16 |
0xFF5A |
Lqpd |
16 |
6-101 |
PLqpd |
16 |
0-32 Hoặc 128-160 |
PPqpd |
8 16 |
0-255, PLqpd < 128 0-65 535, PLqpd ≥ 128 |
Sqpd |
8 |
Bảng A.12 |
SPqpdi |
Biến đổi |
Bảng A.12 |
A.3.12 Thành phần khu vực lượng tử hóa (QPC)
Chức năng: Mô tả sự lượng tử hóa được sử dụng để nén một thành phần cụ thể, cấp độ phân giải và khu vực.
Cách dùng: Tiêu đề chính và tiêu đề phần khối ảnh tùy ý. Một số phân đoạn nhãn QPC có thể xuất hiện trong tùy ý tiêu đề phần ngói, nhưng chỉ có một cho mỗi thành phần, cấp độ phân giải, và khu vực. Nếu QPC được sử dụng trong một tiêu đề phần ngói, nó sẽ thay thế các đặc tính lượng tử hóa xác định bởi QCD, QCC, hoặc phân đoạn nhãn QPD cho bộ ba chỉ mục của QPC trong phạm vi của ngói cụ thể. Vì vậy, các đặc tính lượng tử hóa thành phần cụ thể, cấp độ phân giải và khu vực được xác định bởi sự hiện diện của các dấu hiệu QCD, QCC, QPD hoặc QPC trong thứ tự ưu tiên sau đây:
Phần khối ảnh QPC tùy ý > phần khối ảnh QPD tùy ý > phần khối ảnh QCC thứ nhất > phần khối ảnh QCD thứ nhất > QPC Cơ bản > QPD Cơ bản > QCC Cơ bản > QCD Cơ bản
Trong đó phân đoạn nhãn QPC được sử dụng, Chúng phải xuất hiện trong tiêu đề phần khối ảnh trước bất cứ một gói tin nào được tìm thấy trong để đánh chỉ mục các thành phần cấp độ phân giải và khu vực.
Chiều dài: Thay đổi tùy thuộc vào số lượng tử hóa băng phụ trong chỉ mục cấp độ phân giải lập
Hình A.12 – Cú pháp thành phần khu vực lượng tử hóa
QPC: Mã đánh dấu. Bảng A.48 Hiển thị kích thước và các giá trị của các biểu tượng và các tham số cho sự lượng tử hóa phân đoạn nhãn thành phần.
Lqpc: Chiều dài của phần đoạn nhãn theo byte (không bao gồm các điểm đánh dấu). Giá trị của tham số này được xác định bởi phương trình sau đây:
Trong đó num_sub-bVÀs_lev có thể lấy từ F.2.4 đối với từng độ phân giải và cho dù phân đoạn nhãn có no_quant, quant_derived, và quant_phân tích được báo hiệu trong tham số Sqpc.
CHÚ THÍCH -Lqpc có thể được sử dụng để xác định bao nhiêu bước kích thước được hiện diện trong đoạn đánh dấu. Tuy nhiên, không nhất thiết phải sự tương ứng với số băng phụ trình bày bởi vì các băng phụ có thể được cắt ngắn với không yêu cầu để hiệu chỉnh phân khúc đánh dấu này.
Cqpc: Chỉ số của các thành phần mà phân đoạn nhãn liên quan. Các thành phần lập chỉ mục 0,1,2, vv (hoặc 8 hoặc 16 bit tùy thuộc vào giá trị Csiz.)
PLqpc: Các chỉ số cấp độ phân giải cho báo hiệu các giá trị sự lượng tử hóa. Phương trình A-11 cho thấy làm thế nào phân đoạn nhãn này được xây dựng dựa trên các chỉ số cấp độ phân giải, lev, cũng như chỉ số khu vực, prec.
Chỉ số cấp độ phân giải, lev, có giá trị từ 0 to NL, trong đó NL là số cấp độ phân rã định nghĩa trong ITU-T Rec. T.800 | ISO/IEC 15444-1, A.6.1.
PPqpc: Các chỉ số khu vực cho báo hiệu các giá trị sự lượng tử hóa. Kích thước của tham số phân đoạn nhãn này sẽ là một byte khi tham số PLqpc là ít hơn 128, nhưng hai byte khi PLqpc khi lớn hơn hoặc bằng với 128. Tham số này sau đó chỉ cần giữ chỉ mục khu vực, prec. Chỉ số khu vực, prec, có thể nằm trong khoảng từ 0 đến numprecincts -1, trong đó numprecincts là một số khu vực tại cấp độ phân giải lev và cũng được định nghĩa trong ITU-T RecT.800 | tiêu chuẩn ISO/IEC 15444-1, B.6.
Sqpc: Kiểu lượng tử hóa cho thành phần này độ phân giải, lev, và khu vực, prec.
SPqpci: Sự lượng tử hóa các giá trị cho các băng phụ thứ l ở cấp độ phân giải, lev, trong F.2.4, được xác định, số lượng tham số ít lớn như số băng phụ trong phần khối ảnh phù hợp với số lượng lớn nhất của băng phụ ở cấp độ phân giải, lev.
Bảng A.48 – Các giá trị tham số thành phân khu vực lượng tử hóa
Tham số |
Kích thước (bits) |
Giá trị |
QPC |
16 |
0xFF5B |
Lqpc |
16 |
5-199 |
Cqpc |
8 16 |
0-255; nếu Csiz < 257
0-16 383; Csiz ≥ 257 |
PLqpc |
16 |
0-32 hoặc 128-160 |
PPqpc |
8 16 |
0-255, PLqpd < 128
0-65 535, PLqpd ≥ 128 |
Sqpc |
8 |
Bảng A.12 |
SPqpci |
Biến đổi |
Bảng A.12 |
Phụ lục B
(Quy định)
Độ lệch DC biến thiên, phần mở rộng
(Phụ lục là phần tích hợp với tiêu chuẩn)
Trong phụ lục này và các điều nhỏ của phụ lục, các biểu đồ và bảng chỉ có tính quy định trong trường hợp chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này mô tả phần mở rộng để Khuyến nghị T800 của ITU| Tiêu chuẩn ISO/IEC 15444-1 có thể được sử dụng đơn thuần hoặc kết hợp với bất kỳ của các phần mở rộng khác trong để nghị | Chuẩn quốc tế này, ngoại trừ sự Biến đổi nhiều thành phần trong phụ lục J. Khả năng của dòng mã được xác định bởi tham số phân đoạn nhãn kích thước Rsiz (xem A.2.1).
Phụ lục này xác định độ lệch DC biến đổi để Biến đổi các giá trị có dấu hệ quả quá trình giải mã cho các mẫu tái tạo thích hợp. Nó có thể được áp dụng cho với cả dữ liệu có dấu và thành phần dữ liệu không dấu.
B.1 Luồng độ lệch DC biến thiên
Đối tượng độ lệch DC biến đổi xảy ra bên ngoài tùy ý biến đổi thành phần, tức là, trước khi biến đổi thành phần trong mã hóa và sau khi biến đổi thành phần trong giải mã. Hình vẽ B.1 Hiển thị dòng Độ lệch DC biến đổi trong hệ thống với một Biến đổi nhiều thành phần theo Khuyến nghị T800 của ITU| Tiêu chuẩn ISO/IEC 15444-1, phụ lục G
Hình B.1 – Phân bổ độ lệch DC có biến đổi nhiều thành phần
Hình vẽ B.2 Hiển thị dòng của Độ lệch DC biến đổi trong hệ thống mà không có một biến đổi nhiều thành phần từ ITU-T Rec T.800 và ISO/IEC 15444-1, Phụ lục G.
Hình B.2 – Phân bổ bù DC không có biến đổi nhiều thành phần
B.2 Độ lệch DC ngược
Nếu đoạn đánh dấu DCO có mặt trong tiêu đề chính hoặc phần khối ảnh (xem A.3.1), sau đó Độ lệch DC biến đổi, Oj, được chỉ định bởi điểm đánh dấu đó. Tất cả các mẫu của thành phần nhất định được bù đắp bằng cách thêm số lượng tương tự cho mỗi mẫu như sau:
I’ (x,y) = I(x,y) + Oi (B-1)
Nếu không có phân đoạn nhãn DCO tồn tại, thì Độ lệch DC biến đổi được thực hiện như mô tả trong Khuyến nghị T800 của ITU| Tiêu chuẩn ISO/IEC 15444-1, phụ lục G.
CHÚ THlCH – nếu I không cùng độ chính xác hoặc phạm vi động như dữ liệu đầu ra nó có thể được làm tròn đến độ chính xác gần nhất và cắt bớt trong giới hạn.
B.2 Độ lệch DC ngược
Độ lệch DC biến đổi cho phép người dùng kiểm soát thực tế giá trị bù, độ lệch, Oi, có thể được chọn bất kỳ giá trị nào, nhưng gợi ý trong phạm vi động và độ chính xác của dữ liệu gốc. Giá trị mặc định cho dữ liệu không dấu là:
(B-2)
Trong đó Ssizi đến từ khuyến nghị ITU-T T.800 | Tiêu chuẩn ISO/IEC 15444-1, phụ lục A. Cho dữ liệu có dấu mặc định trong khuyến nghị ITU-T T.800 | Tiêu chuẩn ISO/IEC 15444-1, phụ lục G, cũng không có độ lệch (Oj = 0). Bất kỳ giá trị khác phải được báo hiệu trong một phân đoạn nhãn DCO hoặc tiêu đề chính hoặc tiêu đề phần ngói. Tất cả đầu vào dữ liệu là độ lệch bằng cách trừ độ lệch cố định từ tất cả các mẫu trong thành phần ngói. Khi sử dụng biến đổi độ lệch DC biến đổi kết hợp với một biến đổi đảo ngược, các độ lệch nên là một giá trị số nguyên.
I(x, y) = I’(x, y) – Oi (B-3)
Khi một độ lệch không mặc định được sử dụng, phải để ý để điều chỉnh số bit bảo vệ để tính đến bất kỳ sự gia tăng tiềm năng ở bit độ sâu dữ liệu bù đắp. Nếu độ lệch, Oj, được chọn trong phạm vi động của dữ liệu gốc, thì tăng số lượng bit bảo vệ, G, bởi một trong những sẽ là đủ để xử lý bất kỳ tăng tiềm năng nào.
Đối với hầu hết các ảnh thiết lập bù đắp mặc định cho hiệu suất nén tốt. Tuy nhiên đối với một số ảnh có thể đã đạt tới đỉnh biểu đồ, với một số lượng nhỏ của dữ liệu tương phản cao, cải thiện đáng kể hiệu suất có thể thu được nếu được đặt gần các chế độ của biểu đồ (histogram).
Phụ lục C
(Quy định)
Lượng tử hóa vô hướng biến thiên, phần mở rộng
(Phụ lục là phần tích hợp với tiêu chuẩn)
Phụ lục C lượng tử hóa vô hướng biến đổi, phần mở rộng (phụ lục này tạo thành một phần của tiêu chuẩn này)
Trong phụ lục này và các điều nhỏ của phụ lục, các biểu đồ và bảng chỉ có tính quy định trong trường hợp chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này mô tả một phần mở rộng khuyến nghị ITU-T T.800 | Tiêu chuẩn ISO/IEC 15444-1 có thể được sử dụng đơn thuần hoặc kết hợp với bất kỳ của các phần mở rộng khác trong tiêu chuẩn này. Khả năng của dòng mã được xác định bởi tham số phân đoạn nhãn kích thước Rsiz (xem A.2.1).
Lượng tử hóa vô hướng biến đổi mở rộng sự lượng tử hóa vô hướng mặc định được mô tả trong khuyến nghị ITU-T T.800 |Tiêu chuẩn ISO/IEC 15444-1, phụ lục E, để cho phép Miền không đổi s của chiều rộng biển (lên đến bốn lần kích thước bước). Lượng tử hóa vô hướng biến đổi sẽ chỉ được sử dụng với bộ lọc không thể đảo ngược.
C.1 Lượng tử hóa vô hướng biến thiên
Tất cả các thuật ngữ và các biến được mô tả trong Khuyến nghị T800 của ITU| Tiêu chuẩn ISO/IEC 15444-1, phụ lục E, vẫn như cũ đối với các biến vô hướng lượng tử hóa. Một tham số bổ sung nzb được sử dụng để truyền đạt kích thước điều chỉnh mẫu. Kích thước điều chỉnh là 2(1-nzb)Δb. Khi nz = 0 tức là là tương đương với vô hướng XviD trong ITU-TT.800 | Tiêu chuẩn ISO/IEC 15444-1, phụ lục E, với một mẫu hai lần kích thước bước đã nêu. Khi nzb > 0 thì miền không đổi nhỏ hơn, và khi nzb > 0 thì miền không đổi lớn hơn. Giá trị của nzb phải nằm trong phạm vi [-1, 1)1). Khi nz = 0 cho tất cả các băng phụ, không cần phải truyền tải các yếu tố điều chỉnh mẫu. Tuy nhiên, nếu nzb ≠ 0 cho ít nhất một băng phụ, sau đó mở rộng QCD, QCC, QPD, và/hoặc QPC phân đoạn nhãn sẽ xuất hiện trong tiêu đề chính hoặc tiêu đề phần khối ảnh đầu tiên của một ngói nhất định (xem A.2.4). Giá trị nzb được thể hiện như:
Khi một QCD, QCC, QPD, QPC mở rộng phân đoạn nhãn xuất hiện, các yếu tố điều chỉnh là một trong hai báo hiệu cho mỗi băng phụ một cách rõ ràng, hoặc báo hiệu chỉ cho LL băng phụ. Trước đây được biết đến như phân tích ra điều chỉnh và sau này được gọi là có nguồn gốc ra điều chỉnh. Trong trường hợp thứ hai, tất cả ra điều chỉnh yếu tố nzb có nguồn gốc ngầm từ việc điều chỉnh đơn ra yếu tố nz0 tương ứng với băng phụ LL, theo công thức sau:
nzb = nz0 (C-2)
C.2 Phục hồi lượng tử hóa vô hướng biến thiên đối với các bộ lọc không thuận nghịch
Phục hồi lượng tử vô hướng tổng quát với bộ lọc không hướng ngược giá trị phục dựng được tính toán như sau:
Trong đó nzb là yếu tố điều chỉnh truyền ra từ mở rộng QCD, QCC, QPD, QPC phân đoạn nhãn và tất cả các thông số khác như mô tả trong ITU-T T.800 | Tiêu chuẩn ISO/IEC 15444-1 phụ lục E. Nếu không có mở rộng QCD, QCC, QPD, QPD phân đoạn nhãn áp dụng đối với một thành phần trong dòng mã, sau đó nzb = 0 cho tất cả các băng phụ. Khi nzb = 0 công thức này là giống hệt nhau đối với phi lượng tử vô hướng được sử dụng với bộ lọc không thể đảo ngược trong Khuyến nghị T800 của ITU| Tiêu chuẩn ISO/IEC 15444-1 phụ lục E.
Lượng tử hóa vô hướng biến thiên sẽ chỉ được sử dụng với các biến đổi không thể đảo.
C.3 Lượng tử hóa vô hướng biến thiên đối với các bộ lọc không thuận nghịch (thông tin)
Hệ số lượng tử hóa, qb(u, v), được tính từ hệ số phi lượng tử, ab(u, v), bởi:
Trong đó b là kích thước bước sự lượng tử hóa bao gồm trong QCD, QCC, QPD, QPC phân đoạn nhãn của ITU-T T.800 | Tiêu chuẩn ISO/IEC 15444-1 phụ lục A, và nzb là một tham số điều chỉnh mẫu bao gồm trong mở rộng QCD, QCC, QPD, QPC đánh dấu phân đoạn. Nếu nzb = 0 cho tất cả các băng phụ, thì nó không cần được báo hiệu. Nếu nzb là giống hệt nhau cho tất cả các băng phụ, thì báo hiệu nguồn có thể được sử dụng trong mở rộng QCD, QCC, QPD, QPC đánh dấu phân đoạn.
Phụ lục D
(Quy định)
Mở rộng lượng tử hóa mã lưới
(Phụ lục là phần tích hợp với tiêu chuẩn)
Trong phụ lục này và các điều nhỏ của phụ lục, các biểu đồ và bảng chỉ có tính quy định trong trường hợp chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này mô tả một phần mở rộng để ITU-T T.800 | Tiêu chuẩn ISO/IEC 15444-1 có thể được sử dụng đơn thuần hoặc kết hợp với bất kỳ của các phần mở rộng khác trong tiêu chuẩn này. Khả năng của dòng mã được xác định bởi tham số phân đoạn nhãn kích thước Rsiz (xem A.2.1). Phụ lục này xác định lựa chọn sự lượng tử hóa (TCQ) lưới mắt cáo mã hóa cho mã hóa và tái tạo lại một chuỗi các hệ số sóng. TCQ sẽ chỉ được sử dụng với các biến đổi không thể đảo ngược.
D.1 Giới thiệu về lượng tử hóa mã lưới (TCQ)
Thuật toán TCQ áp dụng lượng tử hóa vô hướng không gian thay đổi vào tuần tự bằng cách chọn một trong bốn lượng tử vô hướng cho mỗi mẫu. chỉ số siêu lượng tử của những lượng tử cùng với quá trình biến đổi lượng tử dưới hình thức lưới mắt cáo cung cấp tất cả thông tin cần thiết để tái tạo lại TCQ mã hóa hệ số sóng con.
Hình D.1 Mô tả bốn lượng tử vô hướng riêng biệt (D0, D1, D2, VÀ D3) được dùng cho tiêu chuẩn này. Bao gồm với Hình này là các thông tin liên quan đến chỉ số lượng tử hóa vô hướng , mức độ tái tạo , và cuối cùng liên minh chỉ số lượng tử đối với mỗi lượng tử vô hướng.
Hình D.1- Các lượng tử hóa vô hướng sử dụng cho TCQ
Hình D.2 cho thấy sự kết hợp của các lượng tử vô hướng vào liên minh lượng tử, A0 và A1, cùng với các chỉ số có sẵn với mỗi lượng tử và các đơn vị tái tạo lại tương ứng
Hình D.2 – Các lượng tử hóa kết hợp với TCQ
Tám trạng thái lưới mắt cáo biểu diễn đồ thị với quá trình Biến đổi có thể của bộ lượng tử hiển thị trong Hình D.3, chạy từ trái sang phải, trong đó mà mỗi nút đại diện cho một trạng thái lưới. Cột của nút đại diện cho giai đoạn sắp xếp từ trái sang phải. Chính xác các K + 1 giai đoạn nếu dữ liệu K điểm được lượng tử hóa. Mỗi nút trong hình D.3 đánh nhãn là Nk, s, trong đó k tương ứng với các chỉ số giai đoạn cho các nút và s là trạng thái lưới mắt cáo của nút.
Hình D.3 – Các chỉ số biểu thị nút lưới
D.2 Định nghĩa tuần tự
Xử lý TCQ được thực hiện độc lập trên mỗi khối mã. Các hệ số của một khối mã đã cho được quét theo thứ tự mô tả trong ITU-T Rec T.800 | ISO/IEC 15444-1, D.1, dưới dạng các hệ số tuần tự được xử lý bởi TCQ.
D.3 Lượng tử hóa TCQ hướng thuận (thông tin)
Tất cả TCQ trình tự khối mã trong một băng phụ cụ thể b sử dụng cùng một sự lượng tử hóa kích thước bước Δb. Không có tùy chọn đặc biệt của sự lượng tử hóa vô hướng được mô tả trong Khuyến nghị T800 của ITU| Tiêu chuẩn ISO/IEC 15444-1, E.2, không có lựa chọn cụ thể của kích thước bước là cần thiết cho TCQ. Trong thực tế, các giá trị εb và μb trong đó Δb có thể được bắt nguồn từ Khuyến nghị T800 của ITU| Tiêu chuẩn ISO/IEC 15444-1 phương trình E-5. Một thuật toán được đề nghị cho việc lựa chọn các thiết lập của Δb là của Lagrange tỷ lệ phân bổ (LRA) được định nghĩa trong D.5.
Bất kể các thuật toán lựa chọn Δb, tham số ε6 và μb được xác định để đại diện cho Δb mong muốn bởi các công thức sau đây:
Trong đó, như mô tả trong Khuyến nghị T800 của ITU| Tiêu chuẩn ISO/IEC 15444-1, E.1, Rb là phạm vi động của băng phụ b. Các giá trị số εb và μb được sử dụng để thiết lập các tham số SPqcdi SPqcci, SPqpdi, SPqpci trong phân đoạn nhãn QCD, QCC, QPD, QPC (xem ITU-T Rec T.800 | ISO/IEC 15444-1, A.6.4 và A.6.5).
Một số LUTs được sử dụng cho mục đích lượng tử hóa chuyển tiếp. Bảng D.1 chỉ ra bốn LUTs định nghĩa trước: và định nghĩa nút chủ đối với Nk,s trong lưới; và định nghĩa lượng tử hóa vô hướng dẫn đến Nk,s từ nút chủ của nó. Năm giá trị khác LUTs là để duy trì trong quá trình lượng tử hóa chuyển tiếp.
– qD (Di) Giữ chỉ số lượng tử hóa tốt nhất cho mỗi lượng tử hóa vô hướng;
– dD (Di) Giữ kết quả biến dạng bởi mỗi lượng tử hóa vô hướng;
– dN (Nk,s) Giữ biến dạng tích lũy ở nút Nk,s, (Biến dạng tồn tại);
– B (Nk,s) Giữa nút chủ mà thu nhận được biến dạng tồn tại thấp nhất ở nút Nk,s;
– qN (Nk,s) Giữ chỉ số cho bộ lượng tử hóa từ nút chủ (Nk,s) to Nk,s.
Hoàn thành thuật toán mã hóa TCQ mà quyết định chỉ số trình tự lượng tử hóa qk cho một chuỗi các khối mã cụ thể được nêu trong Hình D.4 và Bảng D.2. Ngoài ra, tối ưu hiệu suất TCQ tiến bộ đạt được khi dữ liệu ngẫu nhiên ba thẻ mã hóa (xem ITU-T Rec T.800 | ISO/IEC 15444-1, D.3) cho bit san bằng cuối của một khối mã nhất định tập trung vào một gói duy nhất.
Hình D.4 – Xử lý TCQ hướng thuận
Bảng D.1 – Các LUT đối với k > 0 trong lưới Hình D.3
Nút |
Nút chủ |
Bộ lượng tử vô hướng chính |
||
|
|
|
|
|
Nk, 0 |
Nk – 1,0 |
Nk – 1,1 |
D0 |
D2 |
Nk, 1 |
Nk – 1,2 |
Nk – 1,3 |
D1 |
D3 |
Nk, 2 |
Nk -1,4 |
Nk – 1,5 |
D2 |
D0 |
Nk, 3 |
Nk – 1,6 |
Nk – 1,7 |
D3 |
D1 |
Nk, 4 |
Nk – 1,0 |
Nk – 1,1 |
D2 |
D0 |
Nk, 5 |
Nk – 1,2 |
Nk – 1,3 |
D3 |
D1 |
Nk, 6 |
Nk – 1,4 |
Nk – 1,5 |
D0 |
D2 |
Nk, 7 |
Nk – 1,6 |
Nk – 1,7 |
D1 |
D3 |
Bảng D.2 – Mô tả các khối chức năng trong Hình D.4
Khối |
Mô tả |
Khởi tạo | Đặt dN (N0,0) = 0 và dN (N 0,s) = ∞ với s = 1, …, 7. Đặt k = 0. |
SQ | Đối với mỗi bộ lượng tử hóa Di (i = 0, 1, 2, 3), tìm chỉ số lượng tử hóa tốt nhất và tính toán sai số bình phương của nó, vv
Và đặt qD (Di) bằng giá trị chỉ số nhỏ nhất m. |
Nhãn | Đối với mỗi giai đoạn s = 0, …, 7: |
D1 | Ở cuối của trình tự dữ liệu? |
Inc k | Chỉ số trình tự tăng k. |
Tìm lại | Đặt k = K. tìm smin (out of smin = 0, …, 7) và dN(Nk,Smin) là tối thiểu. Đặt N = Nk,smin).
Khi (k > 0): qk – 1 = qN (N) N = B(N) k = k – 1 |
A1 Phủ định | Nếu sử dụng liên minh lượng tử A1 và nếu qk = 1 thì đặt qk = -1. Nếu sử dụng liên minh lượng tử A1 và nếu qk = -1 thì đặt qk = 1. |
D.4 Lượng tử hóa hướng ngược chính tắc
Chỉ số lượng tử giải mã TCQ có thể được dựng lại hệ số sóng sử dụng quá trình phi lượng tử TCQ được giới thiệu đầy đủ hoặc một phi lượng tử vô hướng gần đúng. Quá trình phi lượng tử đầy đủ TCQ không nên được sử dụng, Tuy nhiên, khi dọn sạch vượt qua của bit mặt cuối cùng, cho dãy khối mã hiện tại là không giải mã đầy đủ. Điều này có thể xảy ra khi chỉ là một phần của dòng mã đã được truyền đi hoặc giải mã.
D.4.1 Phục hồi lượng tử hóa TCQ đầy đủ
Cách tiếp cận này để dựng lại hệ số các sóng sử dụng cùng một kích thước bước lượng tử hóa theo quy định trong phương trình D-1, trong đó εb và μb, có nguồn gốc từ các tham số SPqcdi, SPqcci, SPqpdi, SPqpci trong phân đoạn nhãn QCD, QCC, QPD, QPC (xem Khuyến nghị T800 của ITU| Tiêu chuẩn ISO/IEC 15444-1, A.6.4 và A.6.5.
Quá trình phục hồi lượng tử toàn phần được phác thảo trong hình D.5 và bảng D.3, D.4 và D.5. dưới đây, đầu vào cho quá trình này là trình tự khối mã của chỉ số TCQ – qk (tương ứng với được định nghĩa trong ITU-T Rec. T.800 | ISO/IEC 15444-1, Equation E-1) và đầu ra của nó là trình tự xk của hệ số sóng tái tạo cho khỗi mã hiện thời.
Hình D.5 – Xử lý hướng ngược đầy đủ đối với các chỉ số TCQ
Bảng D.3 – Mô tả các khối chức năng trong Hình D.5
Khối |
Mô tả |
khởi tạo | Khởi tạo chỉ số trạng thái lưới s và hệ số trình tự k: s = 0; k = 1. |
Cập nhật siêu lượng tử | Đặt chỉ số liên minh lượng tự hóa hiện thời sử dụng bảng D.4: a = A(s). |
Đảo ngược A1 | Nếu a = A1 và nếu qk = 1 thì đặt qk = -1.
Nếu a = A1 và nếu qk = -1 thì đặt qk = 1. |
Dựng lại | Hệ số khuôn dạng dựng lại xk:
Trong đó RA1(m) được định nghĩa trong hình D.2, và r là tham số dựng lại. Cài đặt hợp lý là r = 01,25 khi |qk| ≤ 2 và r = 0 nếu không. |
Cập nhật trạng thái lưới | Cập nhật trạng thái lưới sử dụng bảng D.5: s = S(s, qk). |
D1 | Trình tự cuối mỗi khối mã dữ liệu? |
Inc k | Chỉ số trình tự tăng k. |
Bảng D.4 – Bảng tra cứu đối với A(s)
Trạng thái s |
A(s) |
0 |
A0 |
1 |
A0 |
2 |
A1 |
3 |
A1 |
4 |
A0 |
5 |
A0 |
6 |
A1 |
7 |
A1 |
Bảng D.5 – Bảng tra cứu đối với S(s,qk)
Trạng thái hiện thời s |
qk lẻ/chẵn |
S(s,qk) |
0 |
Chẵn |
0 |
Lẻ |
4 |
|
1 |
Chẵn |
4 |
Lẻ |
0 |
|
2 |
Chẵn |
1 |
Lẻ |
5 |
|
3 |
Chẵn |
5 |
Lẻ |
1 |
|
4 |
Chẵn |
6 |
Lẻ |
2 |
|
5 |
Chẵn |
2 |
Lẻ |
6 |
|
6 |
Chẵn |
7 |
Lẻ |
3 |
|
7 |
Chẵn |
3 |
Lẻ |
7 |
D.4.2 Giải mã lượng tử hóa gần đúng
Không giống giải mã lượng tử hóa toàn phần, cách tiếp cận này sử dụng hai kích thước bước định nghĩa trong công thức D-1. Cụ thể,
Quá trình giải mã lượng tử gần đúng được nêu trong bảng D.6 lẫn hình D.6. Đầu vào cho quá trình này là trình tự khối mã của một phần hoặc chỉ số hoàn toàn giải mã TCQ qk và đầu ra của nó là dãy hệ số sóng dựng lại cho khối mã hiện tại. Kỹ thuật phục hồi lượng tử hóa này tương ứng với phục hồi lượng tử hóa vô hướng cơ bản được mô tả trong Khuyến nghị T800 của ITU| Tiêu chuẩn ISO/IEC 15444-1, và như vậy, không cần xử lý đặc biệt để giải mã chỉ số TCQ hợp lý.
Hình D.6 – Phục hồi lượng tử hóa gần đúng của các chỉ số TCQ
Bảng D.6 – Mô tả các khối chức năng của Hình D.6
Khối |
Mô tả |
Khởi tạo | Khởi tạo chỉ số trình tự k: k = 1. |
LSB số “0” | đầu ra LSB số “0” của qk. |
Dựng lại | Tạo hệ số dựng lại xk:
Trong đó Mb, Nb(k), và r được định nghĩa trong ITU-T Rec. T.800 | ISO/IEC 15444-1, Phương trình E-8. |
D1 | Trình tự dữ liệu khối mã ở cuối? |
Inc k | Tăng chỉ số trình tự k. |
D.5 Quá trình phân bổ tỷ lệ Lơgrăng (thông tin)
Thuật toán này sử dụng ba bộ tham số để xác định tất cả các kích thước bước nhánh phụ. Tập đầu tiên được liệt kê trong bảng D.7 và cung cấp số liệu thống kê cho mỗi bảng phụ, bao gồm cả tiêu chuẩn độ lệch (αb), độ lớn kích thước (αb), độ lớn năng lượng (αb), và mật độ Gaussian tổng quát (GGD) tham số (αb). Tập thứ hai của tham số bao gồm αb và XviD-phụ thuộc tham số được liệt kê trong bảng D.8, D.9, D.10 và D.11. Các tham số được liệt kê trong các bảng dựa trên tỷ lệ thu được bằng thực nghiệm, biến dạng dữ liệu cho cả hai TCQ và sự lượng tử hóa vô hướng kết hợp với dữ liệu ngẫu nhiên mã hóa được mô tả trong Khuyến nghị T800 của ITU| Tiêu chuẩn ISO/IEC 15444-1. Sau cùng, thiết lập tham số cuối cùng đơn giản chỉ là cung cấp tham số tự do α được sử dụng trong thời gian hạn chế giảm thiểu tổng thể ảnh miền lỗi bình phương trung bình.
Bảng D.7 – Thống kê băng con yêu cầu cho LRA
Thống kê |
Mô tả |
σβ | Độ lệch chuẩn cho băng phụ b. |
ββ | Tỉ trọng kích thước của băng phụ b (tỷ lệ thuận với số của các hệ số trong băng phụ b với tổng số điểm ảnh). |
ϒβ | Tỉ trọng năng lượng đối với băng phụ b (Số lượng lỗi bình phương miền ảnh phát sinh bởi lỗi đơn vị trong hệ số sóng đơn đối với băng phụ b). |
αb | Tham số GGD của băng phụ b. được tìm thấy bởi công thức,
Trong đó xk là trình tự của dữ liệu của băng phụ b và . |
Bảng D.8 – Các tham số ρb đối với TCQ
|
αβ = 0,5 |
αβ = 0,75 |
αβ = 1,0 |
αβ = 1,5 |
αβ = 2,0 |
μη |
-1,661 0 |
-1,661 0 |
-1,661 0 |
-1,661 0 |
-1,661 0 |
αη |
-0,298 5 |
0,076 5 |
0,214 4 |
0,302 3 |
0,318 6 |
ψ1 |
-2,300 0 |
3,000 0 |
-0,823 9 |
-0,522 9 |
0,221 8 |
μλ |
0,056 3 |
0,000 0 |
-0,195 0 |
-0,334 4 |
-1,491 7 |
αλ |
0,148 0 |
0,000 0 |
-0,124 0 |
-0,152 6 |
-0,331 1 |
ψ2 |
-2,300 0 |
-2,208 0 |
-0,823 7 |
-0,522 9 |
-0,221 8 |
α |
72,078 1 |
2,254 3 |
70,188 5 |
1,215 3 |
1,326 7 |
ζ |
-0,093 8 |
0,046 0 |
0,048 7 |
0,075 0 |
-0,004 0 |
π |
283,241 4 |
14,772 3 |
598,091 3 |
32,754 8 |
70,803 2 |
|
1,661 0 |
1,661 0 |
1,661 0 |
1,661 0 |
1,661 0 |
Bảng D.9 – Các tham số ∆b cho TCQ
|
αβ = 0,5 |
αβ = 0,75 |
αβ = 1,0 |
αβ = 1,5 |
αβ = 2,0 |
μη’ |
0,500 0 |
0,500 0 |
0,500 0 |
0,500 0 |
0,500 0 |
αη’ |
0,225 0 |
0,225 0 |
0,225 0 |
0,225 0 |
0,225 0 |
ψ1’ |
-4,000 0 |
-3,398 0 |
-3,000 0 |
-3,000 0 |
-2,398 0 |
μλ’ |
0,027 6 |
0,023 7 |
0,031 1 |
0,021 3 |
0,047 3 |
αλ’ |
0,109 6 |
0,082 8 |
0,092 5 |
0,062 7 |
0,108 1 |
ψ2’ |
-4,000 0 |
-3,398 0 |
-3,000 0 |
-3,000 0 |
-2,398 0 |
α’ |
293,330 0 |
32 606 000,000 0 |
399,630 0 |
81 289 000,000 0 |
1 806,700 0 |
ζ’ |
-1,506 7 |
-1,132 9 |
-0,875 9 |
-0,592 2 |
0,581 8 |
π’ |
855,370 0 |
102 500 000,000 0 |
1 523,900 0 |
321 130 000,000 0 |
6 809,000 0 |
|
0,211 7 |
0,302 8 |
0,390 3 |
0,651 8 |
15,378 3 |
Bảng D.10 – Các tham số ρb cho SQ
|
αβ = 0,5 |
αβ = 0,75 |
αβ = 1,0 |
αβ = 1,5 |
αβ = 2,0 |
μη |
-1,661 0 |
-1,661 0 |
-1,661 0 |
-1,661 0 |
-1,661 0 |
αη |
-0,102 6 |
0,274 4 |
0,424 9 |
0,509 5 |
0,528 5 |
ψ1 |
-0,784 7 |
-1,386 3 |
-0,779 1 |
-0,648 2 |
-0,396 8 |
μλ |
0,406 0 |
-0,094 2 |
-0,431 5 |
-0,703 4 |
-1,532 2 |
αλ |
0,318 6 |
-0,130 6 |
-0,336 2 |
-0,455 9 |
-0,607 9 |
ψ2 |
-0,419 1 |
-0,411 5 |
-0,343 5 |
-0,128 2 |
-0,059 9 |
α |
0,591 2 |
0,493 4 |
0,385 9 |
0,150 1 |
0,035 0 |
ζ |
0,172 1 |
0,081 9 |
0,042 4 |
0,022 7 |
-0,024 9 |
π |
3,222 5 |
4,091 5 |
3,867 3 |
2,588 9 |
1,416 3 |
|
1,661 0 |
1,661 0 |
1,661 0 |
1,661 0 |
1,661 0 |
Bảng D.11 – Các tham số ∆b cho SQ
|
αβ = 0,5 |
αβ = 0,75 |
αβ = 1,0 |
αβ = 1,5 |
αβ = 2,0 |
μη’ |
0,500 0 |
0,500 0 |
0,500 0 |
0,500 0 |
0,500 0 |
αη’ |
0,468 7 |
0,468 7 |
0,468 7 |
0,468 7 |
0,468 7 |
ψ1’ |
-2,400 0 |
-1,937 6 |
-1,477 1 |
-1,456 9 |
-1,502 5 |
μλ’ |
0,049 8 |
0,083 7 |
0,064 3 |
0,043 9 |
0,036 4 |
αλ’ |
0,119 6 |
0,162 2 |
0,094 9 |
0,064 0 |
0,054 7 |
ψ2’ |
-2,400 0 |
-1,937 6 |
-1,477 1 |
-1,456 9 |
-1,502 5 |
α’ |
3,474 6 |
10,733 5 |
4,890 8 |
3,805 1 |
5,363 5 |
ζ’ |
-0,635 8 |
-0,526 6 |
-0,600 1 |
-0,513 1 |
-0,028 0 |
π’ |
16,961 5 |
85,298 6 |
82,061 2 |
32,483 8 |
29,983 9 |
|
0,185 1 |
0,146 9 |
0,283 7 |
0,405 1 |
2,085 1 |
Trình xử lý LRA được định nghĩa trong Hình D.7 và Bảng D.12.
Hình D.7 – Tỷ lệ phân bổ Lơgrăng
Bảng D.12 – Mô tả các khối chức năng trong Hình D.7
Khối |
Mô tả |
Đặt | Đặt băng tốc độ bit mong muốn RD. |
Chọn λ | Cung cấp ước lượng ban đầu đối với hệ số Lagrangian. |
Tính ρb | ρb = Rh + Rc + Rl đối với mỗi băng phụ b, trong đó Rh = mhv + ah, |
Tính R* |
|
D1 | R* trong dung sai của ? |
Điều chỉnh λ | Chỉnh đúng λ sau đó và R* nằm trong dung sai. |
Tính Δb | |
Lượng tử | Dùng Δb để lượng tử hệ số sóng. |
Mã hóa dữ liệu ngẫu nhiên | Chạy chỉ số lượng tử hóa thông qua mã hóa độ dài biến đổi. |
Đo RA | Đo và thu được tỉ lệ từ kích thước bước. |
D2 | RA trong phạm vi dung sai của RD? |
Điều chỉnh | Chỉnh đúng đến RA và RD nằm trong giới hạn dung sai. |
Phụ lục E
(Quy định)
Hình ảnh che, phần mở rộng
(Phụ lục là phần tích hợp với tiêu chuẩn)
Trong phụ lục này và các điều nhỏ của phụ lục, các biểu đồ và bảng chỉ có tính quy định trong trường hợp chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này mô tả một phần mở rộng trong khuyến nghị T.800 của ITU-T /Tiêu chuẩn ISO/IEC 15444-1 có thể được sử dụng đơn thuần hoặc kết hợp với bất kỳ của các phần mở rộng khác trong tiêu chuẩn này. Khả năng của dòng mã được xác định bởi tham số Rsiz phân đoạn nhãn kích thước SIZ (xem A.2.1). Phụ lục này mô tả một lựa chọn cho phép bộ mã để khai thác các tính chất mặt nạ của hệ thống thị giác của con người.
E.1 Giới thiệu về mặt nạ thị giác (thông tin)
Mặt nạ thị giác là một cơ chế khi vật phẩm được che bằng ảnh hành động như là một tín hiệu nền. Mục đích chính là để cải thiện chất lượng ảnh, đặc biệt đối với các hiển thị độ phân giải thấp (thường được đo bằng các dấu chấm /in sơ, hoặc DPI). Hiệu quả đầu tiên của kỹ thuật này là để cải thiện chất lượng ảnh, ở đó cải thiện trở nên lớn hơn vì ảnh trở nên phức tạp hơn. Phạm vi cải tiến là trong kết cấu biên độ thấp, chẳng hạn như da. cải thiện các khu vực khác là trong cạnh hình dao (knnếue- edges) (tức là đối với những đối quá trình Biến đổi chiều rộng bằng không) trong ảnh đồ kỹ thuật số. Tác dụng chính thứ hai của kỹ thuật này là đối với tỉ lệ bit cố định, chất lượng ảnh sẽ mạnh mẽ hơn so với các biến thể ảnh phức tạp. Điều này được thực hiện tại các bộ mã hóa thông qua một mở rộng không tuyến tính đan xen giữa giai đoạn Biến đổi và giai đoạn sự lượng tử hóa. Tại các bộ giải mã hướng ngược không tuyến tính được áp dụng sau khi phi lượng tủ trước khi biến đổi sóng hướng ngược (xem hình E.1).
E.2 Mở rộng từng điểm phi tuyến (thông tin)
Tùy chọn mở rộng che xử lý mặt nạ thị giác như là sự kết hợp của hai quá trình riêng biệt, tức là, che tự tương phản và che khu vực lân cận. Các hiệu ứng mặt nạ thị giác được khai thác trong hai bước. Bước đầu tiên khai thác hiệu quả tương tự che bằng cách áp dụng chức năng trọng số từng điểm điện (gọi đây là chức năng bộ biến đổi) hệ số xi ban đầu thu được bằng cách sử dụng một bộ lọc phân tích với gainb (xem khuyến nghị T.800 của ITU-T | ISO/IEC 15444-1, bảng E.1), tức là,
Hình E.1 – Sơ đồ hệ thống đối với phần mở rộng che từng điểm
Hình E.2 – Lượng tử không đều đối với tự che ngược
Phương trình E-1 được áp dụng cho tất cả băng con trên một số độ phân giải được chỉ định sử dụng cùng một giá trị cho α Tham số giả định một giá trị giữa 0 và 1. Một giá trị tiêu biểu của α là 0,7. Thông thường từng điểm mở rộng không tuyến tính không áp dụng cho băng con LL.
Nếu lượng tử đồng đều là để áp dụng cho yi, kết quả kích thước bước lượng tử hóa như là một chức năng của hệ số giá trị xi được thể hiện trong hình E.2. Ngăn lượng tử tăng cùng với việc tăng biên độ hệ số. Bước này giả định rằng mỗi tín hiệu mà hệ số được liên kết nằm trên một nền tảng chung bằng phẳng. Theo giả định này, {yi} là đồng đều. Trong ảnh thực tế, Tuy nhiên, điều này thường không phải là trường hợp. Mỗi tín hiệu chồng vào tín hiệu trong không gian lân cận khác. Có một số hiệu ứng che
che đóng góp từ trong tín hiệu không gian lân cận do sự không chắc chắn pha, kích cỡ trường tiếp nhận, cũng như tác dụng phạm vi dài hơn có thể. Để tiếp tục khai thác hiệu ứng che lân cận, bước thứ hai danh định hóa yi bởi một yếu tố che lân cận wi là một chức năng của biên độ tín hiệu lân cận, tức là,
Trong đó wi là hàm số g(.) của tín hiệu lân cận thông thường được nhận biết bởi bộ giải mã , biểu hiện trong mẫu vect Hoặc như tức là, . Kết quả zi là tùy thuộc vào lượng tử hóa. Một lợi thế của chiến lược này là khả năng phân biệt giữa hệ số biên độ lớn nằm trong một vùng của cấu trúc cạnh đơn từ những phần trong một vùng phức tạp. Tính năng này sẽ đảm bảo chất lượng ảnh tốt của cạnh đơn trên một nền tảng mịn, mà thường quan trọng đối với chất lượng ảnh chủ quan tổng thể, vì yếu tố trọng tâm của vùng lân cận hệ số wi phải được tính bởi các bộ giải mã cũng như các bộ mã hóa, các bộ giải mã tín hiệu cảm nhận phải được tính toán bao gồm các hiệu ứng của lượng tử hóa và phục dựng. Đó là:
Trong đó Q() thể hiện hoạt động lượng tử hóa. Giá trị phụ thuộc vào giá trị tính toán trước đó trong lân cận, vì thế luôn luôn được xác định rõ ràng.
Mô phỏng này của quá trình lượng tử hóa được sử dụng bởi các bộ mã hóa để đảm bảo rằng các bộ mã hóa và giải mã hoạt động chính xác cùng thao tác đề tính toán wi. Đối với mã hóa không khả năng mở rộng, đây là một vấn đề tương đối đơn giản. Các bộ mã hóa sẽ sử dụng hệ số lượng tử lân cận quantized để tính toán yếu tố che lân cận.
Đối với mã hóa nhúng các bộ mã hóa không thể làm việc Biến đổi phi tuyến tính dựa trên một phiên bản nén và bước cuối cùng chính xác của hệ số xk bởi vì “không tuyến tính mở rộng” được áp dụng trước khi nén mở rộng và các bộ giải mã có thể nhận được chút cắt ngắn dòng. Tuy nhiên, sự khác biệt này trong wi có thể được hoàn toàn loại bỏ hoặc giảm bằng cách sử dụng cùng giá trị lượng tử hóa từ chút cắt ngắn hệ số lân cận để tính toán yếu tố hệ số che wi ở các bộ mã hóa và các bộ giải mã.
Điều này được thực hiện bằng cách duy trì chỉ các bits_retained trong các bit trọng số cao cửa Q(|zi|) trong công thức nói trên (Các bit còn lại được thay bằng 0). Miễn là its_retained đủ nhỏ (Với tôn trọng đối với tốc độ bit quan tâm thấp nhất ở bộ giải mã), Các bộ giải mã sẽ có thể có được chính xác các cùng lượng tử hóa (bit ngắn) phiên bản của hệ số lân cận. Thỏa hiệp một phân chia thô cho wi có thể hơi ảnh hưởng đến tính chính xác của mô hình mặt nạ. Nhưng thử nghiệm đã khuyên rằng hiệu suất thường không rất nhạy cảm với phiên bản lượng tử của hệ số lân cận được sử dụng.
Mặt nạ thị giác có thể được áp dụng cho tất cả các cấp độ phân giải có giá trị chỉ số không ít hơn một cụ thể mức thấp nhất mà có thể được xác định trong dòng bit. Ví dụ, nếu mức thấp nhất được thiết lập là 1, sau đó không tuyến tính mở rộng được áp dụng cho tất cả băng con ngoại trừ băng con LL thấp nhất.
E.3 Giải mã có mặt nạ thị giác
Khi đánh dấu VMS (xem A.3.2) tồn tại cho thành phần c, sau đó sẽ xảy ra giữa lượng tử hóa hướng ngược và hướng ngược DWT. Trong thành phần c, cho mỗi băng con với độ phân giải mức độ không ít hơn mức thấp nhất, thực hiện theo công thức trong thứ tự mành để qua băng con b:
Trong đó zi là hệ số cần quan tâm, và gainb là độ khuếch đại của bộ lọc phân tích (Xem khuyến nghị T.800 của ITU-T | ISO/IEC 15444-1, Bảng E.1). Hằng số chuẩn hóa được định nghĩa là trong đó Rl là độ sâu bit Các mẫu thành phần phục dựng được chỉ xác định trong phân đoạn nhãn SIZ (xem T.800 của ITU-T /ISO/IEC 15444-1, A.5.1). Khu vực lân cận là vùng lân cận của hệ số hiện tại zi, có độ cao bình thường (win_width+1) và độ rộng (2win_width+1) (xem hình E.3). Khu vực lân cận không bao gồm hệ số hiện tại, zi, và thu nhỏ để tôn trọng ranh giới băng con . Khu vực lân cận cũng thu nhỏ để tôn trọng ranh giới khối mã nếu respect_block_boundaries = 1.|ϕi| là số điểm ảnh trong khu lân cận zi. Giá trị được tính toán từ phiên bản lượng tử bits_retained zi biểu hiện được chỉ ra trong công thức E-5 và E-6.
với tất cả ngoại trừ bits_retained MSBs thay thế bằng 0. (E-5)
Trong đó ∆b là kích thước bước lượng tử và là số nguyên chứa Mb bit không dấu. Xem T.800 của ITU-T | ISO/IEC 15444-1, E.1, đối với định nghĩa của ∆b và Mb.
CHÚ THÍCH – Ví dụ nếu zi = -36, ∆b = 5, và Mb = 10, thì = 00 0000 0111 (trong nhị phân). Nếu bits_retained < 8 thì, = 0. Nếu bits_retained = 8, thì =4.
Hình E.3 – Khu vực lân cận hệ quả
Giá trị mức thấp nhất, α, β, win_width, respect_block_boundaries, VÀ bits_retained, tất cả có thể khác nhau đối với mỗi thành phần, được đưa ra trong mỗi phân đoạn nhãn VMS (Xem A.3.2).
CHÚ THÍCH – Khi respect_block_boundaries = 1, cho phép thực hiện song song và hạn chế lỗi truyền lan, nhưng nó thể mất một số hiệu năng hoạt động.
E.4 Mã hóa có mặt nạ thị giác (thông tin)
Khi sử dụng mặt nạ ảnh trên thành phần c, sẽ xảy ra giữa DWT và lượng tử hóa. Trong thành phần c, cho mỗi băng con b với độ phân giải r không nhỏ hơn mức thấp nhất, thực hiện theo công thức sau theo thứ tự mành trên băng con b:
Trong đó xi là hệ số sóng con cần xem xét, và tham số gainb, hệ số lân cận, và |ϕi| được định nghĩa trong E.3. Giá trị được định nghĩa trong công thức E-5 và E-6.
Giá trị mức thấp nhất, α, β, win_width, respect_block_boundaries, và bits_retained, tất cả đều khác nhau đối với mỗi thành phần, được ghi trong VMS phân đoạn nhãn (xem A.3.2).
E.5 Các tham số cài đặt (thông tin)
Các tham số β (giả định một giá trị giữa 0 và 1, và cùng với win_width, được sử dụng để kiểm soát mức độ khu vực che lân cận. Tham số (và win_width đóng vai trò quan trọng trong phân biệt các hệ số xung quanh cạnh đơn từ những phần trong khu vực phức tạp. Win_width tham số điều khiển mức độ 82 trung bình; (β kiểm soát ảnh hưởng của biên độ của mỗi hệ số lân cận. Nó quan trọng bởi vì (giả định β có giá trị nhỏ hơn 1. Giá trị tốt là 0,2. Điều này giúp bảo vệ hệ số xung quanh cạnh sắc nét đơn, kể từ khi các hệ số xung quanh cạnh sắc nét thường có giá trị cao. Một giá trị nhỏ của β ngăn chặn sự đóng góp của vài hệ lớn xung quanh cạnh sắc nét đối với các yếu tố che, do đó ngầm phân biệt các hệ số xung quanh cạnh sắc nét từ hệ số trong một khu vực phức tạp.
Một trường hợp đặc biệt của từng điểm che mở rộng phương pháp tiếp cận tương tự phương pháp che đạt được khi β được đặt về 0. Mặt nạ tự ngược được gọi là trường hợp trong đó tín hiệu mặt nạ chính xác cùng một tần số, định hướng và vị trí như là biến dạng tín hiệu. Cách tiếp cận che này giả định rằng cấu trúc băng con sóng được sử dụng và bộ lọc là một kết hợp tốt để kênh tiềm ẩn của hệ thống thị giác thường không đúng. Do đó, nó có thể có một vấn đề che quá mức ở cạnh đường chéo, đặc biệt là đối với tốc độ bit thấp.
Một số thông số được mã hóa vào phân đoạn nhãn VMS (xem A.3.2) là các tham số α, β, bits_retained (số bit thấp được giữ lại cho việc thu thập lượng tử hóa hệ số lân cận), win_width (một nửa chiều rộng cửa sổ khu vực lân cận quan hệ nhân quả, ví dụ, N = 2win_width + 1), và mức thấp nhất (mức tần số thấp nhất mà che sẽ bắt đầu). Một tập hợp tốt các giá trị cho các tham số là tương ứng 0,7, 0,2, 9, 6 và 1. Khóa Respect_block_boundaries cũng được bao gồm trong các phân đoạn nhãn VMS.
E.6 Khả năng tương thích với các công nghệ khác (thông tin)
Mở rộng che hình ảnh hoạt động với cả lượng tử hóa vô hướng và TCQ (xem phụ lục D) cho bộ lọc không thể đảo ngược. Nó có thể được kết hợp với hệ số tần số trục quan trọng (xem ITU-T vị T.800 | ISO/IEC 15444-1, J.12) để tiếp tục cải thiện chất lượng ảnh. Thông thường, Hệ số Biến đổi nhân với hệ số CSF trước khi chúng phải chịu các chức năng “bộ biến”. Trong một số triển khai, Tuy nhiên, nó thuận tiện hơn để trao đổi các hoạt động vì các hệ số CSF sau đó có thể được tích hợp vào tối ưu hóa tốc độ biến dạng. Để làm điều này, hệ số CSF, ban đầu được thiết kế cho vùng X, phải được sửa đổi để chúng có thể được áp dụng trong miền z; chúng phải được nâng lên đến hệ số mũ α.
Phụ lục F
(Quy định)
Phân tách tùy ý của thành phần khối ảnh, phần mở rộng
(Phụ lục là phần tích hợp với tiêu chuẩn)
Trong phụ lục này và các điều nhỏ của phụ lục, các biểu đồ và bảng chỉ có tính quy định trong trường hợp chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này mô tả một phần mở rộng trong khuyến nghị T.800 của ITU |Tiêu chuẩn ISO/IEC 15444-1 có thể được sử dụng đơn thuần hoặc kết hợp với bất kỳ của các phần mở rộng khác trong tiêu chuẩn này. Khả năng của dòng mã được xác định bởi tham số phân đoạn nhãn kích Rsiz (xem A.2.1).
Phần mở rộng được mô tả trong phụ lục này chỉ định các tùy chọn có sẵn để tạo thành phân tác sóng băng con. Công ước mô tả lần đầu tiên được giới thiệu bản cập nhật cho các phương trình, văn bản, phân tách và thủ tục từ khuyến nghị T800 của ITU-T| tiêu chuẩn ISO/IEC 15444-1. Nhiều phần trong số các thủ tục mới và cập nhật là định nghĩa đệ quy. Ngoại trừ biến bao gồm trong danh sách tham số đầu ra thủ tục đệ quy, tất cả các biến cho thủ tục đệ quy được duy trì với bản sao nội bộ mà không thay đổi bên ngoài phạm vi của thủ tục.
F.1 Băng con sóng con
Tiêu chuẩn này cung cấp bốn tầng của chi tiết để xác định hai chiều băng thông tín hiệu (được gọi là băng con) ở độ phân giải không gian khác nhau. Mỗi tầng cung cấp thêm thông tin trong việc xác định chi tiết tốt hơn trong cấu trúc phân tách băng con. Các tầng được định nghĩa dưới đây, bắt đầu với tầng với của chi tiết mức thấp nhất.
F.1.1 Tầng 1: Số mức phân tách
Tầng đầu tiên trong việc xác định các phân tách băng con là số lượng độ phân tách, NL Giá trị này báo hiệu cho mỗi thành phần khối ảnh trong các dấu hiệu COD hoặc COD như quy định trong bảng A.15 của Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1. Như với khuyến nghị | Quốc tế tiêu chuẩn đó, chỉ số phân tách là 1 cho các cao độ phân giải băng con và NL độ phân giải thấp nhất cho băng con. Chỉ số độ phân giải, mặt khác, được gắn nhãn với giá trị 0 cho độ phân giải thấp nhất và NL cho độ phân giải cao nhất. Giá trị là 0 cho NL cho thấy không có biến đổi sóng cho phần khối ảnh.
F.1.2 Tầng 2: Hình thành độ phân giải
Độ phân giải không gian khác nhau thu được thông qua phần nối/không nối ngang và /hoặc giảm lượng tử đứng độ phân giải cao. Do đó, độ phân giải không gian với subsampling các yếu tố từ ảnh ban đầu khác nhau trong hướng ngang và dọc được cho phép. Như trong khuyến nghị T.800 của ITU- T | Tiêu chuẩn ISO/IEC 15444-1, định hướng của mỗi độ phân giải không gian (hoặc băng con) được chỉ định với một mã hai ký tự, trong đó chữ cái đầu tiên chỉ ra lọc ngang, ký tự thứ hai cho thấy lọc dọc, và chữ L và H cho biết thông tháp hoặc lọc thông cao lấy 1/10 bởi cơ số hai. Phụ lục này cũng cung cấp cho ký tự thứ ba X để cho biết không có lọc dọc/ lọc ngang và lấy 1/10. Kể từ khi độ phân giải không gian không được tạo ra với xử lý thông cao và không có hai độ phân giải không gian như vậy, có ba khả năng định hướng cho mỗi độ phân giải: LL, LX, hoặc HX. Các tín hiệu cần thiết để xác định độ phân giải hình thành đạt được thông qua điểm đánh dấu COD, COC và phân đoạn DFS (xem A.2.3 và A.3.3) như mô tả trong F.2.5.
F.1.3 Tầng 3: Phân tách mức con
Băng con sóng từ hai tầng đầu tiên của sóng xử lý có thể được tiếp tục bị phân tách thành tiểu băng con mới với mức độ giảm bang thông. Khái niệm về phân tách cấp phụ được sử dụng để truyền đạt chi tiết tầng này. Một tối đa tuyệt đối của ba cấp phụ phân tách có thể được tạo ra tại phân tách cấp lev, với cấp phụ đầu tiên phát sinh từ sự phân tách của mức độ phân giải cao nhất tiếp theo. Sử dụng các ADS phân đoạn nhãn (xem A.3.4) cho báo hiệu cấp phụ, θ(lev), cho mỗi cấp độ phân tách, tối đa được mô tả trong F.2.
F.1.4 Tầng 4: Phân chia chiều ngang và dọc đối với độ sâu mức con thay đổi
Không phải tất cả các băng con phải được phân tách đến độ sâu cấp phụ tối đa. Kết quả là, bộ băng con với kích thước đồng bộ ở mức độ phân tách tương tự có thể được sản xuất. Bảng tìm kiếm (LUTs) S() và J() được định nghĩa trong F.2 Hiển thị như thế thông tin trong các phân đoạn nhãn ADS (xem A.3.4) được sử dụng để báo hiệu độ sâu cấp phụ khác nhau trong suốt toàn bộ phân tách sóng.
Băng con cũng có thể được chia ra ngắt kết nối trong hướng ngang và dọc, do đó cho phép băng con với yếu tố lượng tử con từ ảnh ban đầu khác nhau trong hướng ngang và dọc. Kết quả là, băng con có thể được tiếp tục bị phân tách thành ba bộ băng con mới, như mô tả trong hình F.1. Tập đầu tiên đã phân tách phụ cấp với LL, HL, LH và HH định hướng dẫn đến từ chung chia tách ngang và dọc như trong Khuyến nghị T.800 của ITU-T| tiêu chuẩn ISO/IEC 15444-1. Tập thứ hai sản lượng chỉ LX và HX định hướng mà kết quả từ chỉ ngang chia tách của một băng con. Các thiết lập cuối cùng cung cấp định hướng XL và XH là kết quả của chỉ dọc chia tách.
Ngoài việc chỉ ra thứ cấp độ sâu, LUT S() cung cấp chi tiết cần thiết để xác định phần và xử lý ngắt ngang/dọc. Hình vẽ F.1 cũng hiển thị như thế nào các yếu tố của S() được chỉ định để xử lý như vậy. Kết quả của xử lý ngang và dọc, băng con có thể được sản sinh trong xử lý sóng có yếu tố khác nhau giảm lượng tử ngang và dọc từ ảnh ban đầu. LUT R(lev) được định nghĩa trong F.2 để chỉ định mức độ và hướng của phân tách cấp lev.
Mỗi trong số bộ ba LUTs (S(), J() và R()) được sử dụng trong hầu hết các thủ tục quy định tại phụ lục này. Tuy nhiên, để tránh lộn xộn, sử dụng các LUTs trong thủ tục một không rõ ràng xác định trừ khi những LUTs được sửa đổi bởi thủ tục đó.
F.1.5 Hoàn thiện ký hiệu băng con
Một ký hiệu hai chấm (:) tách ra được sử dụng để nhãn chỉ số b của băng con ab cho cách tiếp cận phân tách bốn tầng sóng được xác định trong phụ lục này. Ký hiệu này (mà là một phần mở rộng đơn giản mà được đưa ra trong ITU-T vị T.800 | ISO/IEC 15444 – 1) Bắt đầu với một chỉ số lev tương ứng với mức độ phân tách của băng con, theo định hướng 2 ký tự phân tách thứ cấp đầu tiên. Cho các băng con với lớn hơn một cấp phụ, một dấu (:) sau cùng với định hướng phân tách cấp phụ thứ hai. Một(:) cuối cùng với định hướng phân tách thứ cấp thứ ba kết thúc các ký hiệu cho các băng con với lớn hơn hai cấp phụ.
Tìm F.1- Khả năng chia tách của băng con
F.1.6 Toán tử băng con hướng ngang, hướng dọc và hướng chủ yếu
Để hỗ trợ các định nghĩa của các thủ tục trong phụ lục này, các nhà điều hành HORHoặcient (ab) đề cập đến các hoạt động lọc cuối (H, L hay X) mà đã được áp dụng theo hướng ngang sang một căn cứ băng con nhất định, trong khi các hoạt động VerHoặcient (ab) đề cập đến cuối lọc hoạt động (H, L hay X) đã được áp dụng theo hướng thẳng đứng sang một căn cứ băng con nhất định. Các hoạt động PrimeHoặcient(ab) được sử dụng để chỉ định hướng (LL, LX, XL, HL, LH, HX, XH hoặc HH) của cao nhất phụ cấp băng con mà cuối cùng đẻ vào băng con ab trong mức độ phân tách tương tự. Ví dụ, cho băng con ab= a2LH:HX, HORHoặcient(ab)= H, VerHoặcient(ab)= X, PrimeHoặcient(ab)= LH.
F.2 Phương trình, văn bản và cập nhật phân tách
Khả năng phân tách tùy ý giới thiệu trong phụ lục này ảnh hưởng đến một số khoản mục của Khuyến nghị T.800 của ITU-T| tiêu chuẩn ISO/IEC 15444-1 bên ngoài của biến đổi sóng. Những mệnh đề bị ảnh hưởng được quy định dưới đây cùng với cập nhật thông tin để phù hợp với phụ lục này.
F.2.1 Cập nhật tham chiếu NLLL
Tài liệu tham khảo chung cho băng con NLLL được thực hiện trong suốt Khuyến nghị T.800 của ITU- T| tiêu chuẩn ISO/IEC 15444-1. Để phù hợp với phần mở rộng quy định tại phụ lục này, các tài liệu tham khảo cần được cập nhật để bất kỳ của những băng con NLLL, NLLX hoặc NLXL.
F.2.2 Cập nhật ngữ cảnh
Các cấp phụ sóng và xử lý ngang/dọc được giới thiệu trong phụ lục này yêu cầu bản Cập nhật để truyền lan ngữ cảnh hiển thị trong bảng D.1 của Khuyến nghị T.800 của ITU-T| tiêu chuẩn ISO/IEC 15444-1. Một bản cập nhật cho bảng này được thể hiện trong bảng F.1, với tài liệu tham khảo được thực hiện để Hình D.2 của Khuyến nghị T.800 của ITU-T| tiêu chuẩn ISO/IEC 15444-1.
Bảng F.1- Cập nhật ngữ cảnh cho ý nghĩa truyền và thẻ mã hóa (coding passes)
Băng con với hướng chủ của LL, LH, LX, XL, hoặc XH |
Băng con với hướng chủ của HL và HX |
Băng con với hướng chủ của HH |
Ngữ cảnh Labela) |
|||||
∑Hi |
∑Vi |
∑Di |
∑Hi |
∑Vi |
∑Di |
∑(Hi + Vi) |
∑Di |
|
2 |
xb) |
x |
x |
2 |
x |
x |
i3 |
8 |
1 |
i1 |
x |
i1 |
1 |
x |
i1 |
2 |
7 |
1 |
0 |
i1 |
0 |
1 |
i1 |
0 |
2 |
6 |
1 |
0 |
0 |
0 |
1 |
0 |
i2 |
1 |
5 |
0 |
2 |
x |
2 |
0 |
x |
1 |
1 |
4 |
0 |
1 |
x |
1 |
0 |
x |
0 |
1 |
3 |
0 |
0 |
i2 |
0 |
0 |
i2 |
i2 |
0 |
2 |
0 |
0 |
1 |
0 |
0 |
1 |
1 |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
a) Các nhãn ngữ cảnh được lập chỉ mục chỉ để nhận dạng thuận tiện trong đặc tả này. Định danh thực tế sử dụng là một vấn đề thực hiện.
b) x = Không quan tâm. |
F.2.3 Các mở rộng phương trình B-14 của ITU-T T.800 | ISO/IEC 15444-1
Phương trình này cho thấy làm thế nào thành phần khối ảnh phân chia thành các cấp độ phân giải, và nên được Cập nhật trong phụ lục này theo:
Việc sử dụng cho các thủ tục GET_HOR_DEPTH và GET_VER_DEPTH được định nghĩa trong hình F.2 trong khi các định nghĩa của các thuật toán này được mô tả trong hình F.3.
Hình F.2 – Các tham số cho các thỦ tục GET_HOR_DEPTH và GET_VER_DEPTH
F.2.4 Các cập nhật còn lại
Từ Khuyến nghị T.800 của ITU-T| tiêu chuẩn ISO/IEC 15444-1 phương trình B-15 (xác định băng con kích thước tbxi và tbyi), phương trình E-4 (xác định độ khuyếch đại băng con gainb) và phương trình E-5 (xác định số lượng các băng con mức độ phân tách, nb) cũng như bộ, O(), băng con nén dữ liệu bên trong gói dòng bit và kích thước xpb và ypb cho các khu vực trong mỗi băng con được xác định cho phụ lục này bởi thủ tục kết thúc trước SET_SUBBVÀ_INFO thể hiện trong Hình F.4 và F.5 cùng với các thủ tục đệ quy RECUR_INFO được xác định bởi cả hai Hình F.6 và F.7.
Thủ tục SET_SUBBVÀ_INFO đầu tiên các cuộc gọi thủ tục INIT_□□VÀ INIT_S_R (được xác định trong F.2.5) để thiết lập LUTs R(), S() và J() sử dụng các thông tin NL, dR(), và IR lấy thông qua phân đoạn nhãn COD, COC và DFS và di(), li, dS() và thông tin IS lấy thông qua các DFS và phân đoạn nhãn ADS (xem A.3.3, A.3.4 và F.2.5). Các bản Cập nhật B-15 cũng tham khảo bảng F.2 dựa trên định hướng của băng con khác nhau. Mặc dù bộ O() được xác định theo thứ tự ngược bởi RECUR_INFO và số lượng lớn của SET_SUBBVÀ_INFO, bước cuối cùng trong SET_SUBBVÀ_INFO đảo ngược thứ tự cho các sản lượng thích hợp của băng con thông tin. Ngoài ra, thủ tục kết thúc trước SET_SUBBVÀ_INFO gọi RECUR_INFO bằng cách sử dụng tham số rPPx và rPPy có các cùng PPx PPy tham số và báo hiệu thông qua COD và đánh dấu COC (xem A.2.3) cho mỗi r độ phân giải như mô tả trong B.6 trong Khuyến nghị T.800 của ITU-T| tiêu chuẩn ISO/IEC 15444-1.
Để tránh giá trị xpb và ypb ít hơn một, cả hai của các giá trị rPPx và rPPy cũng phải lớn hơn hoặc bằng i(NL-r) cho tất cả các cấp độ phân giải trừ độ phân giải r = 0. Cuối cùng, như với hầu hết vòng lặp với j chỉ số chiều dài J(S{ab)), mục j trong RECUR_INFO giảm sai gây ra xử lý để phục hồi trên độ phân giải thấp nhất tiếp theo.
Hình F.3 – Các thủ tục GET_HOR_DEPTH và GET_VER_DEPTH
Hình F.4 – Tham số cho các thủ tục SET_SUBBVÀ_INFO
Hình F.5 – Thủ tục SET_SUBBVÀ_INFO
Hình F.6 – Các tham số cho các thủ tục RECUR_INFO
Hình F.7 – Thủ tục RECUR_INFO
Bảng F.2 – Số lượng cho tính toán các thông tin băng con
HORHoặcient(ab’) |
VerHoặcient(ab‘) |
tb’ xi |
tb’ yi |
nb’ |
xpb’ |
ypb’ |
L |
L |
|
|
n + 1 |
xp/2 |
yp/2 |
H |
L |
|
|
n + 1 |
xp/2 |
yp/2 |
L |
H |
|
|
n + 1 |
xp/2 |
yp/2 |
H |
H |
|
|
n + 1 |
xp/2 |
yp/2 |
L |
X |
|
yi |
n + 1/2 |
xp/2 |
yp |
H |
X |
|
yi |
n + 1/2 |
xp/2 |
yp |
X |
L |
xi |
|
n + 1/2 |
xp |
yp/2 |
X |
H |
xi |
|
n + 1/2 |
xp |
yp/2 |
Hình F.8 – Tham số cho các thủ tục INIT_θ
F.2.5 Các cập nhật với cấu trúc phân tách
Ba ma trận được sử dụng để xác định cấu trúc phân tách cho mỗi thành phần khối ảnh. Mỗi ma trận bao gồm 1 giá trị được báo hiệu trong nhãn DFS và ADS (xem A.3.3 và A.3.4). Ma trận đầu tiên, d□(i), I = 0,…, li-1, được xác định bởi các DOads và lOads phân đoạn nhãn ADS (xem A.3.4) và được sử dụng bởi INIT_θ procedure để xác định số lượng tối đa của cấp phụ, θ(lev), ở mỗi cấp độ phân tách. Việc sử dụng cho thủ tục này được thể hiện trong hình F.8 và các thủ tục chính nó được định nghĩa trong Hình F.9. Nếu đoạn đánh dấu ADS không được xác định cho các thành phần khối ảnh hiện tại, chiều dài Iθ is đặt bằng không.
CHÚ Ý – các giá trị của dθ(i) được sử dụng để đặt tất cả các θ(lev) trong thủ tục này phải không bằng không và do đó tương đương với 1, 2 hoặc 3. mức độ còn lại không được thiết lập trước khi gặp phải sự kết thúc của dθ(i) được thiết lập đến cuối cùng nhập dθ(i),
Thứ hai ma trận, dR(i), i = 0,…, IR-1 được xác định bởi Ddfs và Idfs DFS phân đoạn nhãn và xác định chiều của mỗi cấp độ phân giải. Thứ ba ma trận, dS(i), i = 0, …, lS-1, được xác định bởi các DSads và ISads phân đoạn nhãn ADS (xem A.3.4) và xác định cấu trúc thứ cấp phân tách trong mỗi cấp độ phân tách. Cả hai của các ma trận được sử dụng cùng với đầu vào khác INIT_S_R và LEV_S. Cấu trúc I/O về những quy trình được mô tả trong Hình F.10 và F.12 và các cấu trúc thuật toán tương ứng được xác định trong Hình F.11 và F.13, bảng F.3 và F.4.
Như với I, nếu các phân đoạn nhãn DFS hoặc ADS không được xác định cho khối ảnh thành phần, IR hoặc IS tương ứng được thiết lập bằng không. Khi IR hoặc IS bằng không, biểu đồ INIT_S_R sẽ sửa đổi các ma trận tương ứng để cho phép đầy đủ thứ cấp độ sâu với chia tách phân tách ngang và thẳng đứng chung cho tất cả các băng con trong sự phân tách sóng. Mục đích đầu tiên của các thủ tục này là để xác định S(ab) LUT được định nghĩa như thế nào một băng con ab phân tách thành các băng con khác. LUT này được định nghĩa để S(ab)
bằng các thiết lập của băng con chỉ số cho các phân tách băng con từ băng con ab. Chiều dài LUT J(ab) cũng được xác định bởi những thói quen được số lượng các băng con phân tách từ băng con ab. Vì thế, S(ab) = {S0(ab),…, , trong đó Sj(ab) là chỉ số của băng con thứ j-th được phân tách từ ab. Cũng như vậy, S(ab) = {b} khi ab không không phân tách thêm được nữa. Điều này xảy ra khi chấm dứt số không được sắp xếp chỉ mục trong dS(i) hoặc độ sâu cấp phụ của bảng con ab bằng giá trị lớn nhất (lev), cho phép cho mức độ của nó. Cuối cùng, ghi chú được dùng để biểu thị tập hợp
Hình F.9 – Thủ tục để thiết lập số lượng tối đa của cấp, phụ (lev)
Hình F.10 – Các tham số cho các thủ tục INIT_S_R
Hình F.11 – Thủ tục cấp cao để xác định S(ab) và R(lev)
Hình F.12 – Tham số cho các thủ tục LEV_S
Hình F.13 – Các thủ tục để xác định S(ab)
Mục đích cuối cùng của các thủ tục INIT_S_R và LEV_S là để xác định R(lev) LUT cho mỗi cấp độ phân tách. LUT này chỉ định LL, LX, hoặc XL định hướng băng con mà kết quả từ phụ cấp độ đầu tiên của xử lý sóng cho một mức độ phân tách. Băng con tương ứng thực hiện như là độ phân giải phân tách cấp lev. Có nghĩa là, độ phân giải NL-lev được cho bởi aR(lev).
Bảng F.3 – S(ab) và J(ab) như là một chức năng của dS(i)
dS(iS) |
S(ab) = bộ chỉ số đối với phân tách băng con từ ab |
J(ab) = độ dài của bộ S(ab) |
1 |
{b:LL, b:HL, b:LH, b:HH} |
4 |
2 |
{b:LX, b:HX} |
2 |
3 |
{b:XL, b:XH} |
2 |
Bảng F.4 – S(ab) và J(ab) như là một chức năng của dR(i)
dR(iR) |
S(ab) = bộ chỉ số đối với phân tách băng con từ ab |
J(ab) = độ dài của bộ S(ab) |
1 |
{levLL, levHL, levLH, levHH} |
4 |
2 |
{levLX, levHX} |
2 |
3 |
{levXL, levXH} |
2 |
CHÚ THÍCH – Lược đồ INIT_S_R sử dụng ds(i) và ds(i) phần tử ma trận xác định S(), J(), và R() cho tất cả các cấp phân tách.
Hình F.14 minh chúng a một phân tách mẫu sóng. Trong này phân tách, NL = 3, d□() = 31, /□ = 2, dR() = 123 IR = 3, dS() = 320300203, và IS = 9. Bảng F.5 Hiển thị các đặc tính khác nhau cho phân tách này, bao gồm cả các ký hiệu R() cho mỗi cấp độ, chỉ ra rằng băng con a0LL đại diện cho độ phân giải 3 (ảnh nguyên bản), và độ phân giải 2, 1 và 0 được đại diện bởi băng con a1LL. a2LX và a3XL tương ứng. Như trong Khuyến nghị T.800 của ITU-T| tiêu chuẩn ISO/IEC 15444-1, khu vực được xác định đối với các độ phân giải.
F.3 Biến đổi sóng con rời rạc ngược cho phân tách chung
Quá trình Biến đổi hướng ngược nhiều như thế được mô tả trong phụ lục F.3 của Khuyến nghị T.800 của ITU-T| tiêu chuẩn ISO/IEC 15444-1. Sửa đổi chỉ cần thiết để cung cấp chức năng phân tách tùy ý là IDWT, 2D_SR, và 2D_INTERLEAVE thủ tục quy định tại phụ lục đó.
Hình F.14 – Phân tách sóng mặt mẫu với nhãn băng con
Bảng F.5 – Các đặc điểm đối với phân tách sóng mẫu ở hình F.14
lev |
θ(lev) |
S() |
Băng con cuối cùng s (ab) |
HORHoặcient(ab) / VerHoặcient(ab) |
PrimeHoặcient (ab) |
R(lev) |
0 |
NA |
NA |
a0LL |
L/L |
LL |
0LL |
1 |
3 |
S(a0LL) = {1LL, 1HL, 1LH, 1HH} S(a1LL) = {1LL} S(a1HL) = {1 HL:LX, 1HL:HX} S(a1HL:LX) = {1HL:LX:XL, 1HL:LX:XH} |
|
|
|
|
S(a1HL:LX:XL) = |
a1HL:LX:X |
X/L |
HL |
|
||
{1 HL:LX:XL} |
L |
|
|
|
||
S(a1HL:LX:XH) = |
a1HL:LX:X |
X/H |
HL |
|
||
{1 HL:LX:XH} |
H |
|
|
|
||
S(a1HL:HX) = {1HL:HX} |
a1HL:HX |
H/X |
HL |
|
||
S(a1LH) = {1LH:XL, 1LH:XH} |
|
|
|
1LL |
||
S(a1LH:XL) = {1LH:XL} |
a1LH:XL |
X/L |
LH |
|
||
S(a1LH:XH) = {1LH:XH} |
a1LH:XH |
X/H |
LH |
|
||
S(a1HH) = {1 HH:XL, 1HH:XH} |
|
|
|
|
||
S(a1HH:XL) = {1HH:XL} |
a1HH:XL |
X/L |
HH |
|
||
S(a1HH:XH) = {1HH:XH:LX, |
|
|
|
|
||
1HH:XH:HX} |
|
|
|
|
||
S(a1HH:XH:LX) = |
a1HH:XH: |
L/X |
HH |
|
||
{1HH:XH:LX} |
LX |
|
|
|
||
S(a1 HH:XH:HX) = {1HH:XH:HX} |
a1HH:XH: HX |
H/X |
HH |
|
||
2 |
1 |
S(a1LL) = {2LX, 2HX} |
|
|
|
|
S(a2LX) = {2LX} |
|
|
|
2LX |
||
S(a2HX) = {2HX} |
a2HX |
H/X |
HX |
|
||
3 |
1 |
S(a2LX) = {3XL, 3XH} |
|
|
|
|
S(a3XL) = {3XL} |
a3XL |
X/L |
XL |
3XL |
||
S(a3XH) = {3XH} |
a3XH |
X/H |
XH |
|
F.3.1 Thủ tục sửa đổi IDWT
Thủ tục IDWT gần giống như trong Khuyến nghị T.800 của ITU-T| tiêu chuẩn ISO/IEC 15444-1. Sự khác biệt đối với những thay đổi trong hàm gọi sửa đổi của thủ tục 2D_SR (MOD_2D_SR) cũng như các hàm gọi đến INIT_□ và INIT_S_R. Tuy nhiên, việc sử dụng lần được mô tả trong hình F.15 và các thủ tục thực tế được thể hiện trong hình F.16. Băng con được lưu trữ trong dòng mã được cung cấp để MOD_2D_SR theo thứ tự được cung cấp bởi bộ LUT O() được định nghĩa trong F.2.4.
Hình F.15 – Các tham số cho các thủ tục MOD_IDWT
Hình F.16 – Thủ tục MOD_IDWT
F.3.2 Thủ tục sửa đổi 2D_SR
Những thay đổi lớn được yêu cầu cho 2D_SR từ trong Khuyến nghị T.800 của ITU-T| tiêu chuẩn ISO/IEC 15444-1. Thủ tục này bao gồm các hoạt động kết hợp 2 hoặc 4 băng con vào một băng con kết quả. Thủ tục này cũng phải xử lý xử lý trong suốt tất cả các cấp phụ bên trong một mức độ phân tách . Để xử lý như vậy, một cấu trúc đệ quy được sử dụng cho quy trình này. Các tham số cần thiết cho thủ tục này được thể hiện ở Hình F.17 và các thủ tục mới chính nó trong sơ đồ ở Hình F.18.
Hình F.17 – Các tham số cho các thủ tục MOD_2D_SR
Hình F.18 – Thủ tục MOD_2D_SR
F.3.3 Thủ tục sửa đổi 2D_INTERLEAVE
Thay đổi đáng kể cũng cần thiết cho các thủ tục 2D_INTERLEAVE. Những thay đổi này là do cả hai xử lý cấp phụ và các băng ngang/dọc phân chia tách. Thủ tục này được thể hiện trong Hình F.19 và F.20. Như minh họa trong sau đây của hai hình này, sơ đồ này bây giờ quyết định của ba thủ tục cấp thấp phải được sử dụng để xen kẽ sóng mẫu. Các giá trị của of u0, u1, v0 và v1 trong mỗi của các thủ tục ba cấp thấp là những tham số tbx0, tbx1, tby0 và tby1 như định nghĩa lại ở F.2.4, trong đó ab là băng con được xen kẽ và cuối cùng được dựng lại.
Hình F.19 – Các tham số cho các thủ tục MOD_2D_INTERLEAVE
Hình F.20 – Thủ tục MOD_2D_INTERLEAVE
F.3.3.1 Thủ tục 2D_HV_INTERLEAVE
Thủ tục 2D_HV_INTERLEAVE là tương tự như thủ tục 2D_INTERLEAVE từ Khuyến nghị T.800 của ITU-T| tiêu chuẩn ISO/IEC 15444-1. Việc sử dụng cho thủ tục này được thể hiện trong hình F.21 và các thủ tục thực tế được thể hiện trong hình F.22.
Hình F.21 – Các tham số cho các thủ tục 2D_HV_INTERLEAVE
Hình F.22 – Thủ tục 2D_HV_lNTERLEAVE
Hình F.23 – Các tham số cho các thủ tục 2D_H_INTERLEAVE
F.3.3.2 Thủ tục 2D_H_INTERLEAVE
Các thủ tục 2D_H_INTERLEAVE được xác định trong hình F.23 và F.24 được sử dụng để chứa các xử lý ngắt kết nối theo hướng ngang. Như vậy, thủ tục này yêu cầu khoảng một nửa các thủ tục logic 2D_HV_INTERLEAVE để đan xen mẫu chỉ hướng ngang.
Hình F.24 -Thủ tục 2D_H_INTERLEAVE
F.3.3.3 Thủ tục 2D_V_INTERLEAVE
Cách mẫu cho các xử lý sóng hướng thẳng đứng là như thế cho các thủ tục được định nghĩa ở trên trong F.3.3.2. Các thủ tục cho trường hợp này được mô tả ở Hình F.25 và F.26
Tìm F.25 – Các tham số cho các thủ tục 2D_V_INTERLEAVE
Hình F.26 – Thủ tục 2D_V_INTERLEAVE
F.4 Biến đổi sóng con rời rạc hướng thuận cho phân tách chung (thông tin)
Tương tự như quá trình Biến đổi ngược, Biến đổi sóng chuyển tiếp yêu cầu thay đổi để chỉ FDWT, 2D_SD, và 2D_DEINTERLEAVE thủ tục. Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1
F.4.1 Thủ tục sửa đổi FDWT
Giống như các thủ tục MOD_IDWT, FDWT vẫn còn nhiều như trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1. Các tham số cho thủ tục này được thể hiện ở hình F.27 và cấu trúc của các thủ tục được thể hiện trong hình F.28.
Hình F.27 – Các tham số cho các thủ tục MOD_FDWT
Hình F.28 -Thủ tục MOD_FDWT
F.4.2 Thủ tục sửa đổi 2D_SD
Những thay đổi lớn được yêu cầu cho 2D_SD từ đó trong Khuyến nghị T.800 của ITU-T| tiêu chuẩn ISO/IEC 15444-1. Thủ tục này bao gồm hoạt động tách một băng con vào băng con kết quả phụ 2 hoặc 4. Thủ tục này cũng phải xử lý xử lý trong suốt tất cả các cấp phụ bên trong một mức độ phân tách . Để xử lý như vậy, một cấu trúc đệ quy được sử dụng cho quy trình này. Các tham số cần thiết cho thủ tục này được thể hiện ở Hình F.29 và các thủ tục mới chính nó phác thảo ở Hình F.30.
Hình F.29 – Các tham số cho các thủ tục MOD_2D_SD
Hình F.30-Thủ tục MOD_2D_SD
F.4.3 Thủ tục sửa đổi 2D_DEINTERLEAVE
Thay đổi đáng kể cũng là cần thiết cho các thủ tục 2D_DEINTERLEAVE. Những thay đổi này là do cả hai phụ cấp xử lý và các băng con ngang/dọc phân chia tách. Thủ tục này được thể hiện trong Hình F.31 và F.32. Như minh họa trong thứ hai của những Hình hai, thói quen này bây giờ quyết định đó của ba thủ tục thấp cấp phải được sử dụng để gỡ đan xen sóng mẫu. Như với các thủ tục MOD_2D_INTERLEAVE, các giá trị của u0, u1, v0 và v1 trong mỗi của các thủ tục cấp thấp hơn ba là những người của tbx0, tbx1, tby0 và tby1 theo quy định tại F.2.4 cho băng con ab mà đang được phân tách /gỡ đan xen.
Hình F.31 – Các tham số cho các thủ tục MOD_2D_DEINTERLEAVE
Hình F.32 – Thủ tục MOD_2D_DEINTERLEAVE
F.4.3.1 Thủ tục 2D_HV_DEINTERLEAVE
Thủ tục 2D_HV_DEINTERLEAVE là tương tự như thủ tục 2D_DEINTERLEAVE từ Khuyến nghị T.800 của ITU-T| tiêu chuẩn ISO/IEC 15444-1. Việc sử dụng cho thủ tục này được thể hiện trong hình F.33 và các thủ tục thực tế được thể hiện trong hình F.34.
Hình F.33 – Các tham số cho các thủ tục 2D_HV_DEINTERLEAVE
Hình F.34 – Thủ tục 2D_HV_DEINTERLEAVE
Hình F.35- Các tham số cho các thủ tục 2D_H_DEINTERLEAVE
F.4.3.2 Thủ tục 2D_H_DEINTERLEAVE
Thủ tục 2D_H_DEINTERLEAVE được sử dụng để chứa các chế biến theo chỉ hướng ngang. Như vậy, thủ tục này đòi hỏi một nửa khoảng logic trong thủ tục 2D_HV_DEINTERLEAVE ở trên. Sơ đồ của thủ tục này được đưa ra trong hình F.35 và F.36.
Hình F.36 – Thủ tục 2D_H_DEINTERLEAVE
F.4.3.3 Thủ tục 2D_V_DEINTERLEAVE
Thủ tục gỡ đan xen mẫu do các xử lý sóng hướng thẳng đứng là khá như vậy cho các thủ tục được định nghĩa trong F.4.3.2. Các thủ tục cho trường hợp này được mô tả ở Hình F.37 và F.38
Hình F.37 – Các tham số cho các thủ tục 2D_V_DEINTERLEAVE
Hình F.38 – Thủ tục 2D_V_DEINTERLEAVE
Phụ lục G
(Quy định)
Biến đổi ảnh đối xứng mẫu đầy đủ, phần mở rộng
(Phụ lục là phần tích hợp với tiêu chuẩn)
Tiêu chuẩn sử dụng biến đổi của các khối ảnh thành phần.
Trong phụ lục này và các điều nhỏ của phụ lục, các biểu đồ và bảng chỉ có tính quy định trong trường hợp chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này xác định hai tiện ích mở rộng của băng con tái thiết thủ tục 1D_SR (xem khuyến nghị T.800 của ITU-T | ISO/IEC 15444 – 1): thủ tục 1D_SR_WS và thủ tục 1D_SD_WS cho toàn bộ-mẫu đối xứng (WS) biến đổi sóng con.
G.1 Các tham số, định nghĩa và chuẩn hóa biến đổi sóng con
Bảng G.1 liệt kê các tham số được sử dụng trong các biến đổi sóng được báo hiệu trong dòng mã. Hệ thống cho các tham số được xác định trong phân đoạn nhãn ATK (xem A.3.5).
Bảng G.1 – Tham số để biến đổi sóng
Tham số |
Ý nghĩa |
Các giá trị |
Coeff_Typ | Loại số của hệ số bước dịch | 8-bit signed integer
16-bit signed integer 32-bit float 64-bit float 128-bit float |
Filt_Cat | Thể loại chuyển đổi sóng | arbitrary (ARB)
whole-sample symmetric (kVS) |
WT_Typ | Loại chuyển đổi sóng | irreversible (IRR)
reversible (REV) |
Minit | Đặc tính cập nhật của bước dịch phục dựng | even-subsequence update (0)
odd-subsequence update (1) |
NLS | Số bước dịch | 8-bit unsigned integer |
□s | Cơ sở lũy thừa cơ số 2 của bước dịch s
(Chuyển đổi hướng ngược) |
8-bit unsigned integer: defined fHoặc 0 □ s < NLS |
□s | Dư lượng thêm của bước dịch s
(Chuyển đổi hướng ngược) |
Coeff_ Typ:
defined fHoặc 0 □ s < NLS |
K | Hệ số tỷ lệ
(Chuyển đổi không hướng ngược) |
Coeff_Typ |
LS | Số hệ số đối với bước dịch s | 8-bit unsigned integer: defined fHoặc 0 □ s < NLS |
□s,k | kth hệ số dịch đối với bước dịch s | Coeff_Typ:
defined fHoặc 0 □ s < NLS 0 □ k < LS |
G.2 Phục dựng biến đổi sóng con đối xứng mẫu đầy đủ
Các thủ tục được chỉ định trong phần này áp dụng chỉ trong trường hợp của phân đoạn nhãn ATK cho đó Filt_Cat = WS.
G.2.1 Chuẩn hóa biến đổi sóng con WS
Điều này chỉ định các điều kiện trên một dòng mã tuân thủ phải đáp ứng các thông số.
Định nghĩa Ds phải là tổng αs hệ số nâng, k cho bước nâng s, 0 ≤ s < NLS (chuẩn hóa trong trường hợp của biến đổi đảo ngược):
Xác định tham số Bs đệ quy:
với điều kiện ban đầu là: B-1 = 1 và B-2 = 1.
G.2.1.1 Chuẩn hóa biến đổi sóng con thuận nghịch
Đối với biến đổi sóng thể đảo ngược (WT_Typ = REV), các thông số Bs phải đáp ứng một trong những điều kiện sau đây:
G.2.1.2 Chuẩn hóa biến đổi sóng con không thuận nghịch
Đối với biến đổi sóng không thể đảo ngược (WT_Typ = IRR), các tham số Bs và tham số tỉ lệ, K, phải đáp ứng một trong những điều kiện sau đây:
G.2.2 Thủ tục phục dựng băng con một chiều đối với biến đổi sóng con WS
Thủ tục xây dựng lại (1D_SR_WS) hết băng con được thực hiện như là một chuỗi các bước nâng nguyên thủy, Luân phiên sửa đổi số lẻ lập chỉ mục mẫu với một trọng số mẫu chẵn-lập chỉ mục và lập chỉ mục ngay cả mẫu với một trọng số lẻ lập chỉ mục mẫu.
G.2.2.1 Thủ tục 1D_SR_WS
Như minh chúng trong hỉnh G.1, 1D_SR_WS thủ tục như đầu vào ma trận một chiều, Y, của băng thông thấp xen kẽ và hệ số băng thông cao, i0 chỉ số của mẫu đầu tiên trong ma trận Y, chỉ số i1 của mẫu sau mẫu cuối cùng trong ma trận Y. Nó tạo ra như là đầu ra một ma trận, X, với các chỉ số tương tự (i0, i1).
Hình G.1-Các thông số của thủ tục 1D_SR_WS
Đối với các tín hiệu của chiều dài một (ví dụ, i0 = i1-1), thủ tục 1D_SR_WS đặt giá trị của X(i0) để X(i0) = Y(i0) nếu i0 là một số nguyên chẵn, và để X(i0) = Y (i0) / 2 nếu i0 là một số nguyên lẻ. Cho các tín hiệu của chiều dài lớn hơn hoặc bằng hai (tức là, i0 < i1-1), như minh họa trong hình G.2, thủ tục 1D_SR_WS áp dụng các thủ tục 1D_FILTR_WS cho Y để tạo ra các tín hiệu dựng lại, X.
Hình G.2 – Thủ tục 1D_SR_WS
CHÚ THÍCH – không giống như trong Khuyến nghị T.800 của ITU-T| tiêu chuẩn ISO/IEC 15444-1, thủ tục 1D_SR_WS không mở rộng các tín hiệu trước khi áp dụng các thủ tục 1D_FILTR_WS. Thay vào đó, một thủ tục tương đương với các thủ tục mở rộng được bao gồm trong thủ tục 1D_FILTR_WS.
G.2.2.2 Các thủ tục 1D_FILTR_WS
Hai phiên bản của thủ tục xây dựng lại (1D_FILTR_WS) được chỉ định, tùy thuộc vào việc Biến đổi có thể đảo ngược hay không (WT_Typ = REV hoặc IRR). Trong hai khoản phụ sau, các chức năng PSEO(i) bằng các chức năng PSEO (I, i0, i1) được chỉ định trong Khuyến nghị T.800 của ITU-T| tiêu chuẩn ISO/IEC 15444-1, phương trình F-4.
G.2.2.2.1 Thủ tục phục dựng một chiều thuận nghịch (1D_FILTR_WS)
Như minh họa trong hình G.3, thủ tục các tham số đầu vào 1D_FILTR_WS có V, i0, i1, NLS, và αs,k, βS, εS, LS fHoặc s = 0, 1, 2, ..., NLS – 1 VÀ k = 0, 1, 2, …, LS – 1.
Hình G.3 – Thông số của thủ tục 1D_FILTR_WS
Thủ tục 1D_FILTR_WS bắt đầu với NLS sau bước nâng, trong đó s biến giảm từ NLS-1 đến 0 (với s = NLS-1, NLS-2,…, 1, 0):
Trong đó mNLS-1 = minit và ms = 1 – ms+1 chỉ ra rằng bước nâng thứ s cập nhật hệ số chỉ mục chẵn (mS = 0) Hoặc hệ số chỉ mục lẻ (mS = 1), Trong đó Lsla là hệ số nâng đối với bước nâng s, và dải của n được định nghĩa bởi i0 ≤ 2n + mS < i1.
Giá trị V(k) với i0 ≤ k < i1 được định dạng đầu ra W(k) của thủ tục 1D_FILTR:
W(k) = V(k) (G-3)
G.2.2.2.2 Thủ tục phục dựng một chiều không thuận nghịch (1D_FILTR_WS)
Như nêu trong hình G.4, các tham số đầu vào của thủ tục 1D_FILTR_WS có V, i0, i1, K, NLS, và αs,k, LS với s = 0, 1, 2, …, NLS – 1 và k = 0, 1, 2, …, LS -1.
Hình G.4 – Các tham số của thủ tục 1D_FILTR_WS
Thủ tục 1D_FILTR_WS bắt đầu với các bước kích thước sau:
V (2n) = K·V (2n) for i0 ≤ 2n < ii (G-4)
and V (2n + 1) = (1 / K) · V (2n + 1) for i0 ≤ 2n + 1 < ii (G-5)
Thủ tục 1D_FILTR_WS thực hiện tiếp theo NLS bước nâng (fHoặc s = NLS – 1, NS – 2, … , 1, 0):
Trong đó mNLS-1 = minit và ms = 1 – mS+1 chỉ ra bước nâng thứ s cập nhật hệ số chỉ mục chẵn (mS = 0) hoặc hệ số chỉ mục lẻ (mS = 1), Trong đó Ls là số hệ số bước nâng s, và dải của n được định nghĩa bởi i0 ≤ 2n + mS < i1.
Giá trị của V(k) như vậy i0 ≤ k < i1 từ đầu ra W(k) của thủ tục 1D_FILTR_WS:
W(k) = v(k) (G-7)
G.3 Phân tách biến đổi sóng con đối xứng mẫu đầy đủ (thông tin)
1D_SD_WS thủ tục phân tách một tạo độ băng con được thực hiện như là một chuỗi các bước nâng nguyên thủy, Luân phiên sửa đổi lập chỉ mục lẻ mẫu với một trọng số mẫu chẵn – lập chỉ mục và lập chỉ mục ngay cả mẫu với một trọng số lẻ lập chỉ mục mẫu.
G.3.1 Thủ tục 1D_SD_WS (thông tin)
Như minh chứng a trong hình G.5, thủ tục 1D_SD_WS lấy đầu vào một ma trận một tạo độ, X, i0 chỉ số của mẫu vật đầu tiên trong ma trận X và i1 chỉ số của mẫu sau mẫu cuối cùng trong ma trận X. chúng sinh ra như đầu ra một ma trận, Y, của xen kẽ thông thấp và thông cao hệ số, với các chỉ số tương tự (i0, i1).
Hình G.5 – Thông số của thủ tục 1D_SD_WS
Đối với các tín hiệu của chiều dài lớn hơn một (ví dụ, i0 = i1-1), thủ tục 1D_SD_WS đặt giá trị của Y(i0) để Y(i0) = X(i0) nếu i0 là một số nguyên chẵn, và để Y(i0) = 2X(i0) nếu i0 là một số nguyên lẻ.
Đối với các tín hiệu của chiều dài lớn hơn hoặc bằng hai (tức là, i0 < i1-1), như minh họa trong hình G.6, thủ tục 1D_SD_WS áp dụng các thủ tục 1D_FILTD_WS cho X để sản sinh các tín hiệu phân tách, Y.
Hình G.6 – Thủ tục 1D_SD_WS
GHI CHÚ: không giống như ở Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, thủ tục 1D_SD_WS không mở rộng các tín hiệu trước khi áp dụng các thủ tục 1D_FILTD_WS. Thay vào đó, một thủ tục tương đương với các thủ tục mở rộng được bao gồm trong thủ tục 1D_FILTD_WS.
G.3.2 Thủ tục phân tách một chiều 1D_FILTD_WS (thông tin)
Hai phiên bản của các thủ tục phân tách được chỉ định, tùy thuộc vào việc Biến đổi có thể đảo ngược hay không (WT_Typ = REV hoặc IRR). Trong hai khoản phụ sau, các chức năng PSEO(i) bằng các chức năng PSEO (I, i0, i1) được chỉ định trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444- 1, phương trình F-4.
G.3.2.1 Thủ tục phân tách một chiều thuận nghịch 1D_FILTD_WS (thông tin)
Như minh họa trong hình G.7, các tham số đầu vào để các phiên bản đảo ngược của thủ tục 1D_FILTD_WS là V, i0, i1, NLS, và αs,k, βs, εs, Ls đối với s = 0, 1, 2, … , NLS – 1 và k = 0, 1, 2, … , LS – 1.
Hình G.7 – Các tham số của thủ tục 1D_FILTD_WS
Thủ tục hướng ngược 1D_FILTD_WS bao gồm trong NLS bước nâng (fHoặc s = 0, 1, 2, … , NLS – 1, bắt đầu với s = 0):
Trong đó mNLS-1 = minit và ms = 1 – ms-1 chỉ ra rằng bước nâng thứ s cập nhật hệ số chỉ mục chắn (mS = 0) hoặc hệ số chỉ mục lẻ (mS = 1), Trong đó Ls là số hệ số nâng đối với vước nâng s, và dải n được xác định bởi i0 ≤ 2n + mS < i1.
Giá trị W(k) = V(k) tạo đầu ra W(k) của thủ tục 1D_FILTD_WS. Giá trị đầu ra là giá trị trong dải i0 ≤ k < i1.
G.3.2.2 Thủ tục phân tách một chiều không thuận nghịch (1D_FILTD_WS) (thông tin)
Như minh họa trong hình G.8, các tham số đầu vào để các phiên bản không thể đảo ngược của thủ tục 1D_FILTD_WS là V, i0, i1, K, NLS, < và s,k, LS đối với s = 0, 1, 2, … , NLS – 1 và k = 0, 1, 2, … , LS – 1.
Hình G.8 – Thông số của thủ tục 1D_FILTD_WS
Thủ tục 1D_FILTD_WS thực hiện bước nâng NLS (fHoặc s = 0, 1, … , NLS – 1, bắt đầu với s = 0):
Trong đó = minit và ms = 1 – ms-1 chỉ ra rằng bước nâng thứ s cập nhật hệ số chỉ mục chắn (mS = 0) hoặc hệ số chỉ mục lẻ ((mS = 1), Trong đó Ls là số hệ số nâng đối với vước nâng s, và dải n được xác định bởi i0 ≤ 2n + ms < i1.
Thủ tục 1D_FILTD_WS kết thúc với hai bước rộng:
V(2n) = (1 / K) · V(2n) for i0 ≤ 2n < ii (G-10)
and V(2n + 1) = K · V(2n +1) for i0 ≤ 2n + 1 < i1 (G-11)
Giá trị W(k) = V(k) tạo ra đầu ra W(k) của thủ tục 1D_FILTD_WS. Giá trị đầu ra có giá trị trong dải i0 ≤ k < i1.
G.4 Ví dụ về biến đổi sóng con WS (thông tin)
Ví dụ về biến đổi sóng được quy định trong điều khoản của báo hiệu các giá trị, được liệt kê trong bảng G.1. Tham số xảy ra trong chuỗi (ví dụ như, Ls, s = 0,…, NLS-1) được liệt kê theo thứ tự ngày càng tăng chỉ số. khuyến nghị ATK phân đoạn nhãn chỉ số giá trị chỉ được thông tin, và bộ giải mã phải xác minh cho dù dòng mã s chứa ATK phân đoạn nhãn được lập chỉ mục với những giá trị này thực sự chứa các biến đổi sóng ví dụ quy định dưới đây.
Cả hai biến đổi sóng từ Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1 được cung cấp ở đây cho các mục đích minh chúng a. Các biến đổi sóng được chỉ định bởi các thủ tục trong phụ lục này kết hợp với các thông số được liệt kê trong bảng G.2 và G.3 toán học tương đương với các biến đổi được chỉ định trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1.
G.4.1 Biến đổi sóng con WS thuận nghịch (WT_Typ = REV) (thông tin)
Giá trị đặc trưng của tham số βS là .
G.4.1.1 Biến đổi sóng con 5-3 thuận nghịch (thông tin)
Biến đổi được chỉ định bởi các giá trị tham số sau là toán học tương đương với việc Biến đổi đảo ngược mặc định được chỉ định trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1.
Bảng G.2 – Thông số của sự chuyển sóng đảo ngược 5-3
Tham số |
Các giá trị |
Chỉ số phân đoạn nhãn ATK |
Nhị phân: 0000 0001 |
minit |
0 |
NLS |
2 |
LS |
1,1 |
αs,k |
α0, 0 = -1 α1, 0 = 1 |
εS |
1, 2 |
βS |
1, 2 |
Phân tách bước đầu tiên (s = 0) được chỉ định với tiêu cực nâng hệ và một dư lượng phụ của 1. Điều này khác biệt rõ ràng với Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1 định nghĩa cần phải có bởi thực tế rằng phân tách thông tin cập nhật có hệ thống được thêm vào các véc tơ đầu vào bởi các thủ tục của phụ lục này trong khi danh sách nâng đảo ngược phân tách đầu tiên bước vào định nghĩa của Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, F.4.8.1, trừ cập nhật của nó. Các bước nâng tái thiết tương ứng cũng khác nhau ở các dấu hiệu của bản cập nhật của chúng. Biến đổi được chỉ định bởi giá trị tham số ở trên, Tuy nhiên, về mặt toán học tương đương với Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1 định nghĩa của sự biến đổi sóng đảo ngược 5-3.
G.4.1.2 Biến đổi sóng con 13-7 thuận nghịch (thông tin)
Bảng G.3 – Các tham số Biến đổi sóng đảo ngược 13-7
Tham số |
Các giá trị |
Chỉ số phân đoạn nhãn ATK |
Nhị phân: 0111 1111 |
minit |
0 |
NLS |
2 |
LS |
2, 2 |
bs,k |
b0, k = -9. 1 b1, k = 5, -1 |
bs |
4, 4 |
bs |
8, 8 |
G.4.2 Biến đổi sóng con WS không thuận nghịch (WT_Typ = IRR) (thông tin)
G.4.2.1 Biến đổi sóng con 5-3 không thuận nghịch (thông tin)
Đây là phiên bản không thể đảo ngược của Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1 Biến đổi sóng đảo ngược 5-3 chỉ định trong G.4.1.1:
Bảng G.4 – Thông số của Biến đổi sóng không đảo ngược 5-3
Tham số |
Các giá trị |
Chỉ số phân đoạn nhãn ATK |
Nhị phân: 0111 0110 |
minit |
0 |
NLS |
2 |
LS |
1, 1 |
bs,k |
α0,0 = α1,0 = |
K |
1 |
G.4.2.2 Biến đổi sóng con 7-5 không thuận nghịch (thông tin)
Bảng G.5 – Thông số của Biến đổi sóng không đảo ngược 7-5
Tham số |
Các giá trị |
Chỉ số phân đoạn nhãn ATK |
Nhị phân: 0111 0101 |
minit |
0 |
NLS |
3 |
LS |
1, 1, 1 |
bs,k |
α0,0 = α1,0 = α2,0 = |
K |
G.4.2.3 Biến đổi sóng con 9-7 không thuận nghịch (thông tin)
Đây là sự Biến đổi sóng không thể thay đổi mặc định được chỉ định trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1; Biến đổi được chỉ định bởi các giá trị tham số là toán học tương đương với Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1 biến đổi. Các biểu thức chính xác cho các giá trị được đưa ra bởi các xấp xỉ thập phân trong bảng G.6 có thể được tìm thấy trong phụ lục F của Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1.
Bảng G.6 – Thông số của Biến đổi sóng không thể đảo ngược 9-7
Tham số |
Các giá trị |
Chỉ số phân đoạn nhãn ATK |
Nhị phân: 0000 0000 |
minit |
0 |
NLS |
4 |
LS |
1, 1, 1, 1 |
bs,k |
b0, 0 = -1.586 134 342 059 924 b1, 0 = -0.052 980 118 572 961 b2, 0 = 0.882 911 075 530 934 b3, 0 = 0.443 506 852 043 971 |
K |
1.230 174 104 914 001 |
Phụ lục H
(Quy định)
Biến đổi ảnh sử dụng phép biến đổi sóng con tùy ý
(Phụ lục là phần tích hợp với tiêu chuẩn)
Tiêu chuẩn này định nghĩa một biến đổi của các thành phần khối ảnh. Trong phụ lục này và các điều nhỏ của phụ lục, các biểu đồ và bảng chỉ có tính quy định trong trường hợp chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ.
Phụ lục này chỉ định một phần mở rộng của băng con tái thiết thủ tục 1D_SR được chỉ định trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1. Cấu trúc bên trong của phần mở rộng này khác với cấu trúc bên trong của thủ tục 1D_SR ở Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1 vì tổng quát hơn của phụ lục này. Các thủ tục trong phụ lục này, 1D_SR_ARB, được chỉ định như là một chuỗi của bước nâng, mỗi trong số đó liên quan đến một hoạt động mở rộng tín hiệu và một hoạt động Cập Nhật. Một hoạt động tỷ lệ được thực hiện trong trường hợp không thể thay đổi Biến đổi sóng. Cú pháp được chỉ định theo đó thực hiện một có thể sử dụng biến đổi sóng báo hiệu trong dòng mã bởi các bộ mã hóa.
H.1 Các tham số và chuẩn hóa biến đổi sóng con
Bảng G.1 liệt kê các tham số lọc cho biến đổi sóng được báo hiệu trong dòng mã. Hệ thống cho các tham số được bao gồm trong đánh dấu ATK phân đoạn (xem A.3.5). Bảng H.1 liệt kê các tham số bổ sung chứa trong đoạn ATK đánh dấu được sử dụng độc quyền trong phụ lục này.
Bảng H.1 – Các tham số bổ sung cho Biến đổi sóng tùy ý
Tham số tag |
Ý nghĩa |
Các giá trị |
Exten | Phương pháp mở rộng biên sử dụng trong bước dịch | Hàng số (CON) lượng tử toàn phần đối xứng (WS) |
offs | Độ lệch fHoặc Inếuting step s | 8-bit số nguyên có dấu: định nghĩa đối với 0 □ s < NLS |
H.1.1 Chuẩn hóa biến đổi sóng con ARB
Các thủ tục được chỉ định trong khoản mục này áp dụng chỉ trong trường hợp của ATK phân đoạn nhãn cho đó Filt_Cat = ARB. Các tham số Ds được định nghĩa trong G.2.1 đại diện cho tổng của hệ số nâng cho bước s, 0 b s < NLS (chuẩn hóa trong trường hợp của biến đổi đảo ngược). Tham số này định nghĩa lại trong phụ lục này như sau:
Các yêu cầu danh định hóa trong G.2.1 vẫn theo quy định, bằng cách sử dụng định nghĩa lại Ds, ở trên.
H.1.2 Khả năng tương thích của biến đổi sóng con ARB và WS
Các biến đổi được xác định trong phụ lục này chiếm một phần mở rộng của các biến đổi quy định tại phụ lục G. Sản lượng tạo ra bởi các thủ tục trong phụ lục G bằng cách sử dụng một phân đoạn nhãn ATK chỉ định Filt_Cat = WS là bằng với sản lượng tạo ra bởi các thủ tục trong phụ lục này nếu các phân đoạn nhãn ATK giải thích bằng cách đặt các tùy chọn mở rộng thành Exten = WS và sửa đổi (“unfolding”) các thông số bộ lọc cho mỗi bước nâng như sau, theo thứ tự được chỉ định:
1) Bản sao trình tự của hệ số dịch: định nghĩa đối với k = 0,…, LS – 1.
2) Hướng ngược nửa đầu trình tự mở rộng của hệ số dịch: đặt đối với k = 0, … , LS – 1.
3) Định nghĩa giá trị của tham số độ lệch: offs = msb Ls.
4) Định nghĩa lại giá trị của tham số chỉ thị số lượng hệ số dịch: Ls = 2Ls.
H.2 Thủ tục phục dựng biến đổi sóng con tùy ý (ARB)
Các thủ tục được chỉ định trong khoản mục này áp dụng chỉ trong trường hợp của ATK phân đoạn nhãn cho đó Filt_Cat = ARB. Việc xây dựng lại mở rộng ban nhạc hết tiểu lọc (1D_SR_ARB) thủ tục quy định tại phụ lục này được chỉ định như là một chuỗi các bước nâng, xen kẽ cập nhật subsequence lẻ với một trọng số mẫu chẵn -lập chỉ mục và cập nhật trình tự ngay cả với một trọng số lẻ lập chỉ mục mẫu. Tùy chọn Biến đổi không thể đảo ngược hoặc đảo ngược báo hiệu bởi tham số WT_Typ.
H.2.1 Thủ tục mở rộng 1D_SR_ARB
Như minh chúng a trong hình H.1, các thủ tục mở rộng 1D_SR_ARB lấy đầu vào một ma trận hết, Y, của xen kẽ hệ số thông thấp và thông cao, chỉ số i0 mẫu đầu tiên trong ma trận Y và i1 chỉ số của mẫu sau mẫu cuối cùng trong ma trận Y. Nó tạo ra như là đầu ra dựng lại một ma trận, X, với các chỉ số tương tự (i0, i1).
Hình H.1 – Thông số của thủ tục mở rộng 1D_SR_ARB
Đối với các tín hiệu của chiều dài một (ví dụ, i0 = i1-1), thủ tục 1D_SR_ARB đặt giá trị của X(i0) để X(i0) = Y(i0) nếu i0 chẵn là một số nguyên, và để X(i0) = Y (i0) / 2 nếu i0 là một số nguyên lẻ.
Đối với các tín hiệu của chiều dài lớn hơn hoặc bằng hai (tức là, i0 < i1-1), như minh họa trong hình H.2, thủ tục 1D_SR_ARB áp dụng một bước rộng trong trường hợp của biến đổi không thể đảo ngược (WT_Typ = IRR) và sau đó áp dụng một chuỗi bước nâng, được xác định bởi tham số từ bảng G.1 và H.1, để tạo ra các tín hiệu dựng lại, X. S biến, lập chỉ mục các bước nâng, giảm từ NLS-1 0 trong quá trình xây dựng lại.
Hình H.2 – Mở rộng thủ tục 1D_SR_ARB
H.2.2 Thủ tục 1D_SCALER
Như minh họa trong hình H.3, thủ tục 1D_SCALER áp dụng một rộng thủ tục để xen kẽ đầu vào VectHoặc V bằng cách sử dụng báo hiệu tham số K từ bảng G.1 và tạo ra một phiên bản cập nhật của vectơ V với cùng một chỉ số (i0, i1). Thủ tục này được sử dụng chỉ trong biến đổi không thể đảo ngược.
Hình H.3 – Thông số của thủ tục 1D_SCALER
Hình H.6 – Thông số của thủ tục 1D_EXT_WS
Thủ tục 1 D_SCALER thực hiện các hoạt động tỷ lệ sau đây:
V(2n) = K ∙ V(2n) for i0 ≤ 2n < i1 (H-1)
and V(2n +1) = (1 /K) ∙ V(2n +1) for i0 ≤ 2n + 1 < i1 (H-2)
H.2.3 Thủ tục 1D_STEPR
Như minh họa trong hình H.4, thủ tục 1D_STEPR áp dụng một tái thiết bước nâng để xen kẽ đầu vào vectơ V và tạo ra một phiên bản cập nhật của vectơ V với cùng một chỉ số (i0, i1).
Hình H.4 – Các tham số của thủ tục 1D_STEPR
Thủ tục 1D_STEPR áp dụng một thủ tục mở rộng, được xác định bởi tham số Exten, đầu vào, V. Điều này theo sau là một cập nhật tái dựng thủ tục lọc, xác định bởi tham số WT_Typ, như đã thấy trong hình H.5. Duy nhất của hai giá trị liên tiếp V (chẵn – hoặc chỉ mục trình tự lẻ), hai được cập chật thông qua 1D_STEPR.
Hình H.5 – Thủ tục 1D_STEPR
H.2.4 Thủ tục mở rộng
Cách chính xác trong đó mở rộng mẫu được truy cập trong thực hiện Tiêu chuẩn này này (ví dụ, bằng cách sao chép mở rộng ma trận, bởi đệm, của địa chỉ gián tiếp hoặc do một số chiến lược khác) là phụ thuộc vào thực hiện, khoản phụ này này là bản quy phạm chỉ phạm vi như nó định nghĩa toán học Tiện ích mở rộng của vectơ chiều dài đủ để cho phép các thủ tục 1D_UPDATER_REV và 1D_UPDATER_IRR để thực hiện hoạt động lọc cập nhật của mình theo quy định, đầu vào.
H.2.4.1 Độ dài mở rộng tối thiểu
Mặc dù thủ tục 1D_EXT_WS và 1D_EXT_CON về nguyên tắc xác định phần mở rộng tự ý dài của vectơ đầu vào, V, số tối thiểu mở rộng mẫu cần thiết đề thực hiện một bước nâng cho trước, s, có thể được tính toán về các tham số Biến đổi sóng cho rằng bước. Tối thiểu phần mở rộng độ dài, ileft và iright, cho bước nâng s được định nghĩa là các số nguyên không âm nhỏ nhất sao cho khoảng [i0 -ileft, i1 -1 + iright] chứa tất cả các chỉ số giải quyết bằng cách cập nhật lọc thủ tục 1D_UPDATER_REV(s) và 1D_UPDATER_IRR(s). Tối thiểu phần mở rộng độ dải cho bước nâng s được đưa ra trong bảng H.2 và H.3 là các chức năng của tính chẵn lẻ của i0 và i1, đặc tính cập nhật, ms, số lượng nâng hệ số, Ls và bù đắp, offs. Chiều dài tối thiểu phần mở rộng là zero bất cứ khi nào một biểu hiện trong một trong những hai bảng đánh giá một số tiêu cực cho một số thiết lập cụ thể của giá trị tham số.
Bảng H.2 – Chiều dài tối thiểu phần mở rộng
ileft: |
ms = 0 |
ms = 1 |
i0 even |
–1 -2 offs |
-2 offs |
i0 odd |
-2 -2 offs |
1-2 offs |
Bảng H.3 – Chiều dài tối thiểu phần mở rộng
ileft: |
ms = 0 |
ms = 1 |
i1 even |
2(Ls – 1 + offs) |
-1 +2(Ls -1 + offs) |
i1 odd |
1 +2(Ls – 1 + offs) |
-2 + 2(Ls – 1 + offs) |
H.2.4.2 Thủ tục 1D_EXT_WS
Như minh họa trong hình H.6, thủ tục 1D_EXT_WS chấp nhận như là đầu vào một vectHoặc V được hỗ trợ trên một khoảng thời gian (i0, i1) và đầu ra một vect Hoặc Vext hỗ trợ trên một khoảng thời gian lớn hơn có chứa các giá trị của l vượt ra ngoài phạm vi i0 < l < i1. Ngoại trừ các phần mở rộng tối thiểu độ dài, ileft và iright (được chỉ ra ở trên trong H.2.4.1), thủ tục này là giống hệt nhau để thủ tục 1D_EXTR được định nghĩa trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, F.3.7. Thủ tục này không sửa đổi véc tơ đầu vào của nó, V.
H.2.4.3 Thủ tục 1D_EXT_CON
Như minh họa trong hình H.7, thủ tục 1D_EXT_CON chấp nhận như là đầu vào một vectHoặc V được hỗ trợ trên một khoảng thời gian (i0, i1) và đầu ra một vectHoặc Vext hỗ trợ trên một khoảng thời gian lớn hơn có chứa các giá trị của I vượt ra ngoài phạm vi i0 b i < i1. Độ dài phần mở rộng tối thiểu cần thiết cho một phần mở rộng tạo ra bởi thủ tục 1D_EXT_CON được quy định ở trên trong H.2.4.1. Thủ tục này không sửa đổi véc tơ đầu vào của nó, V.
Hình H.7 – Thông số của thủ tục 1D_EXT_CON
Thủ tục 1D_EXT_CON xác định phần mở rộng liên tục của dãy con chẵn và lẻ – lập chỉ mục trong V theo các quy tắc sau đây.
Cho i0 □ / < i1:
Vext(i) = V(i)
Cho k □ 1:
Vext(i0 – 2k) = V(i0)
Vext(i0 + 1 – 2k) = V(i0 + 1)
Vext(i1 – 1 + 2k) = V(i1 – 1)
Vext(i1 – 2 + 2k) = V(i1 – 2)
H.2.5 Thủ tục lọc cập nhật phục dựng một chiều
Hai bộ thủ tục dựng lại cập nhật lọc được định nghĩa, một đảo ngược biến đổi (1D_UPDATER_REV) và một cho biến đổi không thể đảo ngược (1D_UPDATER_IRR). Xây dựng lại bước là định nghĩa đệ quy là ngay cả dãy con cập nhật (ms = 0) hoặc dãy lẻ cập nhật (ms = 1), bắt đầu với bước số NLS – 1, có đặc tính cập nhật báo hiệu trong bảng G.1 bởi tham số minit, và đệ quy xuống: ms – 1 = 1 – ms. Cả hai thủ tục có như đầu vào một đầu vào đan xen vectHoặc V và tạo ra như đầu ra một phiên bản cập nhật của vectơ V với cùng một chỉ số (i0, i1).
H.2.5.1 Thủ tục cập nhật phục dựng một chiều thuận nghịch (1D_UPDATER_REV)
Thủ tục 1D_UPDATER_REV sửa đổi chẵn hoặc dãy lẻ lập chỉ mục lẻ trong vect Hoặc V bởi một tổng trọng của mẫu từ trình tự mở rộng, Vext, sau khi áp dụng một hoạt động làm tròn với tổng. Hình vẽ H.8 Hiển thị các thông số đầu vào để thủ tục 1D_UPDATER_REV.
Hình H.8- Thông số của thủ tục 1D_UPDATER_REV
Thủ tục 1D_UPDATER_REV thực hiện lọc cập nhật hoạt động:
f Hoặc all n such that i0 □ 2n + mS < i1.
H.2.5.2 Thủ tục cập nhật phục dựng một chiều không thuận nghịch (1D_UPDATER_IRR)
Thủ tục 1D_UPDATER_IRR sửa đổi hoặc dãy chẵn – hoặc dãy lẻ lập chỉ mục trong vect Hoặc V bởi một tổng trọng của mẫu từ trình tự mở rộng, Vext. Hình vẽ H.9 Hiển thị các thông số đầu vào của thủ tục 1D_UPDATER_IRR.
Hình H.9 – Thông số của thủ tục 1D_UPDATER_IRR
Thủ tục 1D_UPDATER_IRR thực hiện cập nhật hoạt động lọc sau đây:
Đối với toàn bộ n như vậy i0 ≤ 2n + mS < i1.
H.3 Thủ tục phân tách biến đổi sóng con tùy ý (ARB) (thông tin)
Thủ tục lọc phân tách băng con mội tọa độ (1D_SD_ARB) được thực hiện như là một chuỗi các bước nâng, xen kẽ cập chật dãy lẻ với một trọng số mẫu chẵn-lập chỉ mục và cập nhật dãy e ngay cả với một trọng số lẻ lập chỉ mục mẫu.
H.3.1 Thủ tục mở rộng 1D_SD_ARB (thông tin)
Như minh chúng a trong hình H.10, các thủ tục mở rộng 1D_SD_ARB lấy đầu vào một ma trận hết, X, dữ liệu, i0 chỉ số của mẫu vật đầu tiên trong ma trận X và i1 chỉ số của mẫu sau mẫu cuối cùng trong ma trận X. Nó tạo ra như là đầu ra một ma trận, Y, xen kẽ mẫu băng con, với các chỉ số tương tự (i0, i1).
Hình H.10 – Thông số của thủ tục mở rộng 1D_SD_ARB
Đối với các tín hiệu của chiều dài một (ví dụ, i0 = i1-1), thủ tục 1D_SD_ARB đặt giá trị của Y(i0) để Y(i0) = X(i0) nếu i0 là một số nguyên chẵn, và để Y(i0) = 2X(i0) nếu i0 là một số nguyên lẻ.
Đối với các tín hiệu của chiều dài lớn hơn hoặc bằng hai (tức là, i0 < i1-1), như minh họa trong hình H.11, thủ tục 1D_SD_ARB áp dụng một chuỗi các bước nâng, được xác định bởi tham số từ bảng H.1, và sau đó áp dụng một bước rộng trong trường hợp của biến đổi không thể đảo ngược (WT_Typ = IRR) để tạo ra các tín hiệu phân tách phân tách, Y. S biến, lập chỉ mục các bước nâng, tăng từ số không đến NLS-1 trong quá trình phân tách.
Hình H.11 – Thủ tục 1D_SD_ARB
H.3.2 Thủ tục 1D_STEPD (thông tin)
Như minh họa trong hình H.12, thủ tục 1D_STEPD áp dụng một phân tách bước nâng đầu vào véc tơ V và tạo ra một phiên bản cập nhật của vectơ V với cùng một chỉ số (i0, i1).
Hình H.12 – Thông số của thủ tục 1D_STEPD
Thủ tục 1D_STEPD áp dụng một thủ tục mở rộng, được xác định bởi tham số Exten, đầu vào, V. Điều này theo sau là một cập nhật thủ tục lọc phân tách, xác định bởi tham số WT_Typ, như đã thấy trong hình H.13. Duy nhất của dãy V (chẵn – hoặc dãy con lập chỉ mục lẻ), hai được cập nhật trên từng đi qua 1D_STEPD.
Hình H.13 – Thủ tục 1D_STEPD
H.3.3 Thủ tục mở rộng (thông tin)
Phần mở rộng thủ tục 1D_EXT_CON và 1D_EXT_WS Hiển thị trong hình H.13 là giống hệt với các thủ tục quy định tại H.2.4, bao gồm cả các chi tiết kỹ thuật tối thiểu mở rộng độ dài.
H.3.4 Thủ tục cập nhật phân tách một chiều (thông tin)
Hai thủ tục lọc phân tách cập nhật được định nghĩa, một biến đổi hướng ngược (1D_UPDATED_REV) và một cho biến đổi không đảo ngược (1D_UPDATED_IRR). Phân tách bước là định nghĩa đệ quy là ngay cả dãy con cập nhật (ms = 0) hoặc dãy con lẻ cập nhật (ms = 1). Cả hai thủ tục có như đầu vào một vect Hoặc V và tạo ra như đầu ra một phiên bản cập nhật của vectơ V với cùng một chỉ số (i0, i1).
H.3.4.1 Thủ tục cập nhật phân tách một chiều thuận nghịch (1D_UPDATED_REV) (thông tin)
Thủ tục 1D_UPDATED_REV sửa đổi hoặc chẵn – hoặc dãy con chỉ mục lẻ trong vect Hoặc V bởi một tổng; của mẫu từ trình tự mở rộng, Vext, sau khi áp dụng một hoạt động làm tròn với tổng. Hình vẽ H.14 Hiển thị các thông số đầu vào để thủ tục 1D_UPDATED_REV.
Hình H.14 – Thông số của thủ tục 1D_UPDATED_REV
Thủ tục 1D_UPDATED_REV thực hiện hoạt động lọc cập nhật sau đây:
Đối với toàn bộ n vì thế i0 □ 2n + ms < i1.
H.3.4.2 Thủ tục cập nhật phân tách một chiều không thuận nghịch (1D_UPDATED_IRR) (thông tin)
Thủ tục 1D_UPDATED_IRR sửa đổi hoặc chẵn hoặc dãy con chỉ mục lẻ trong vect Hoặc V bởi một tổng của mẫu từ trình tự mở rộng, Vext. Hình vẽ H.15 Hiển thị các thông số đầu vào cho thủ tục 1D_UPDATED _IRR.
Hình H.15 – Thông số của thủ tục 1D_UPDATED_IRR
Thủ tục 1D_UPDATED_IRR thực hiện hoạt động lọc cập nhật sau đây:
Đối với toàn bộ n vì vậy i0 ≤ 2n + ms < i1.
H.3.5 Thủ tục 1D_SCALED (thông tin)
Như minh họa trong hình H.16, thủ tục 1D_SCALED áp dụng một rộng thủ tục để xen kẽ đầu vào vect Hoặc V bằng cách sử dụng báo hiệu tham số K từ bảng H.1 và tạo ra một phiên bản cập nhật của vectơ V với cùng một chỉ số (i0, i1). Thủ tục này được sử dụng chỉ trong biến đổi không thể đảo ngược.
Hình H.16 – Thông số của thủ tục 1D_SCALED
Thủ tục 1D_SCALED thực hiện các hoạt động tỷ lệ sau đây:
V (2n) = (1 / K) · V (2n) for i0 ≤ 2n < i1 (H-7)
and V (2n + 1) = K · V (2n + 1) for i0 ≤ 2n + 1 < i1 (H-8)
H.4 Ví dụ biến đổi sóng con ARB (thông tin)
Ví dụ về biến đổi tùy chọn sóng được quy định trong điều khoản của các tham số được báo hiệu, như được liệt kê trong bảng G.1 và H.1. Tham số xảy ra trong chuỗi (ví dụ như, Ls, s = 0,…, NLS 1) được liệt kê theo thứ tự ngày càng tăng chỉ số. Đề nghị ATK phân đoạn nhãn chỉ số giá trị được thông tin chỉ, và bộ giải mã phải xác minh cho dù dòng mã s chứa ATK phân đoạn nhãn được lập chỉ mục với những giá trị này thực sự chứa các biến đổi sóng ví dụ quy định dưới đây.
H.4.1 Ví dụ biến đổi sóng con tùy ý (Filt_Cat = ARB) (thông tin)
Tất cả các biến đổi sóng ví dụ trình bày trong khoản phụ này được dựa trên giai đoạn tuyến tính biến đổi sóng của các loại được gọi là “nửa-mẫu đối xứng.” Các bộ lọc tương đương xoắn có chiều dài chẵn xung phản ứng, với phản ứng xung đối xứng thông thấp và chống đối xứng thông cao phản ứng xung.
H.4.1.1 Biến đổi sóng con thuận nghịch ARB (WT_Typ = REV) (thông tin)
H.4.1.1.1 Biến đổi sóng con Haar 2-2 thuận nghịch (thông tin)
Bảng H.4 – Các tham số Biến đổi sóng đảo ngược Haar 2-2
Các tham số |
Các giá trị |
Chỉ số phân đoạn nhãn ATK |
Binary: 1111 1111 |
minit |
0 |
NLS |
2 |
LS |
1, 1 |
αs,k |
α0, 0 = -1 α1, 0 = –1 |
εS |
0, 1 |
βS |
0, 1 |
Exten |
CON |
offS |
0, 0 |
H.4.1.1.2 Biến đổi sóng con 2-6 thuận nghịch (thông tin)
Bảng H.5 – Thông số Biến đổi sóng đảo ngược 2-6
Các tham số |
Các giá trị |
Chỉ số phân đoạn nhãn ATK |
Binary: 1111 1110 |
minit |
1 |
NLS |
3 |
LS |
1, 1, 3 |
αs,k |
α0, 0 = -1 α1, 0 = 1 α2, k = 1, 0, – 1 |
εS |
0, 1, 2 |
βσ |
0, 1, 2 |
Exten |
CON |
offS |
0, 0, -1 |
H.4.1.1.3 Biến đổi sóng con 2-10 thuận nghịch (thông tin)
Bảng H.6 – Thông số Biến đổi sóng đảo ngược 2-10
Các tham số |
Các giá trị |
Chỉ số phân đoạn nhãn ATK |
Binary: 1111 1101 |
minit |
1 |
NLS |
3 |
LS |
1, 1, 5 |
αs,k |
α0, 0 = -1 α1, 0 = 1 α2, k = -3, 22, 0, –22, 3 |
εS |
0, 1, 6 |
βS |
0, 1, 32 |
Exten |
CON |
offS |
0, 0, –2 |
H.4.1.2 Biến đổi sóng con ARB không thuận nghịch (WT_Typ = IRR) (thông tin)
H.4.1.2.1 Biến đổi sóng con 6-10 không thuận nghịch (thông tin)
Bảng H.7 – Thông số Biến đổi sóng không đảo ngược 6-10
Các tham số |
Các giá trị |
Chỉ số phân đoạn nhãn ATK |
Binary: 1111 1011 |
minit |
1 |
NLS |
7 |
LS |
1, 1, 2, 1, 2, 1, 3 |
αs,k |
α0, 0 = -1 α1, 0 = 1,586 134 342 06 α2, k = -0,460 348 209 828, 0,460 348 209 828 α3, 0 = 0,25 α4, k = 0,374 213 867 768, -0,374 213 867 768 α5, k = -1,336 134 342 06 α6, k = 0,293 067 171 03, 0, -0293 067 171 03 |
K |
1 |
Exten |
WS |
offS |
0, 0, 0, -1, 0, 0, -1 |
H.4.1.2.2 Biến đổi sóng con 10-18 không thuận nghịch (thông tin)
Bảng H.8 – Thông số Biến đổi sóng không đảo ngược 10-18
Tham số |
Các giá trị |
Chỉ số phân đoạn nhãn ATK |
Nhị phân: 1111 1010 |
minit |
1 |
NLS |
11 |
LS |
1, 1, 2, 1, 2, 1, 2, 1, 2, 1, 5 |
αs,k |
α0, 0 = 1 α1, 0 = 0,997 150 691 05 α2, k = 1,005 731 278 27, 1,005 731 278 27 α3, 0 = 0,270 403 576 31 α4, K = 2,205 099 723 43, □2,205 099 723 43 α5, 0 = 0,080 599 957 36 α6, k = 1,626 825 323 50, 1,626 825 323 50 α7, 0 = 0,520 403 576 31 α8, K = 0,604 046 642 50, □0,604 046 642 50 α9, 0 = 0,827 750 648 41 α10, K = 0,066 158 129 64, 0,294 021 377 20 0, □0,294 021 377 20 , 0,066 158 129 64 |
K |
1 |
Exten |
WS |
offS |
0, 0, 0, -1, 0, 0, 0, -1, 0, 0, -2 |
H.4.2 Ví dụ về cấu trục thực hiện phép nâng của biến đổi sóng con đối xứng nửa-mẫu (thông tin)
Các bước nâng được đưa ra trong hình H.17 đảm bảo rằng các bộ lọc thực hiện được một nửa-mẫu đối xứng. Tham số αs, được sử dụng trong hình H.17 k là khác nhau từ những người sử dụng trong tất cả các phần khác. Chức năng R(x) là một trong hai danh tính R(x) = x (đối với các biến đổi không thể đảo ngược) hoặc đối với Biến đổi đảo người.
Hình H.17 – Thực hiện nâng đối với biến đổi sóng chuyển tiếp của một nửa-mẫu đối xứng
Phụ lục I
(Quy định)
Biến đổi sóng con rời rạc chồng lấn mẫu riêng biệt, phần mở rộng
(Phụ lục là phần tích hợp với tiêu chuẩn)
Trong phụ lục này và các điều nhỏ của phụ lục, các biểu đồ và bảng chỉ có tính quy định trong trường hợp chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này mô tả một phần mở rộng trong khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1 cũng như một phần mở rộng trong phụ lục G có thể được sử dụng đơn thuần hoặc kết hợp với bất kỳ của các phần mở rộng khác trong tiêu chuẩn này. Khả năng của dòng mã được xác định bởi tham số phân đoạn nhãn kích Rsiz (xem A.2.1).
I.1 Giới thiệu chồng lấn mẫu đơn
Phụ lục này chỉ định ba phần mở rộng có thể. Khối mã neo điểm tiện ích mở rộng (CBAP) liên quan đến phân vùng của băng con vào khối mã, và kích hoạt bộ nhớ hiệu quả việc triển khai DWT, cũng như bộ nhớ hiệu quả thao tác hình học của ảnh nén dữ liệu (90 °, phép quay 180 ° và 270 ° và gương hoạt động). Phần mở rộng đơn mẫu chồng chéo (SSO) (xem I.3.1 và I.3.2) liên quan đến các ứng dụng độc lập của sự Biến đổi sóng rời rạc để khối mẫu mà chồng lên nhau của một hàng và cột một, cho phép một bộ nhớ thấp dựa trên khối thực hiện của các biến đổi sóng rời rạc, cả hai phía trước và hướng ngược. Các phần mở rộng đơn mẫu ngói chồng chéo (TSSO) (xem I.3.1 và I.3.2) liên quan đến phân vùng ảnh vào hình khối ảnh mà chồng lên nhau của một hàng và cột một mẫu.
I.2 Điểm định vị khối mã (CBAP) mở rộng
Các tham số zx và zy được báo hiệu trong tham số điểm đánh dấu Scod (xem A.2.3). Nếu chúng đều bằng không, sau đó không sửa đổi cần được thực hiện để Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1. Nếu một trong hai zx và zy là tương đương với 1, sau đó các sửa đổi sau để phụ lục của Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1 cần phải được thực hiện
I.2.1 Phân chia các mức phân giải theo khu vực
Khoản mục này thay thế Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, B.6. Xem xét một hợp phần khối ảnh đặc biệt và mức độ phân giải có mẫu rằng buộc thuộc phạm vi giảm độ phân giải ảnh là (trx0, try0) và (trx1-1, try1-1), như đã mô tả. Hình vẽ I.1 Hiển thị các phân vùng của mức độ phân giải ngói hợp phần này vào khu vực. Các khu vực được neo tại điểm (zx, zy), do đó góc trên bên trái của bất kỳ khu vực nhất định trong các phân vùng nằm ở (zx + m □ 2PPx, zy + n □ 2PPy) trong đó m và n là các số nguyên, và PPx và PPy được báo hiệu trong COD hoặc COC phân đoạn nhãn (xem Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444 – 1A.6.1 và A.6.2). PPx và PPy có thể khác nhau cho mỗi cấp độ thành phần khối ảnh và độ phân giải. PPx và PPy phải là ít nhất 1 cho tất cả các cấp độ phân giải trừ r = 0 trong đó chúng được phép là số không.
Hình I.1 – Các khu vực của một phân giải giảm (sửa đổi hình B.8 của Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444 – 1)
Số khu vực mà mở rộng phần khối ảnh ở cấp độ phân giải, r, được đưa ra bởi
Ngay cả khi phương trình I-1 và I-2 chỉ ra rằng cả hai numprecinctswide và numprecinctshigh là không phải không, một số hoặc tất cả, Khu vực vẫn có sản phẩm nào như được giải thích dưới đây. Chỉ số khu khu vực chảy từ 0-numprecincts–1 trong đó numprecincts = numprecinctswide * numprecinctshigh trong mành đặt hàng (xem hình I.1). Chỉ số này được sử dụng trong việc xác định thứ tự xuất hiện, trong dòng mã, của các gói dữ liệu tương ứng với mỗi khu bầu cử, như được diễn tả trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, B.12. Để cho (px0, py0) và (px1-1, py1-1) là các góc trên bên trái và bên phải thấp hơn của một khu vực từ độ phân giải r như minh họa trong hình I.1. Bản đồ của khu vực này vào ba băng con (NL-r + 1) HL, (NL-r + 1) LH và (NL-r + 1) HH với góc trên bên trái và góc dưới bên phải (px0, py0) và (pbx1-1, pby1-1) trong đó:
(I-3)
(I-4)
(I-5)
(I-6)
Trong đó xob và yob được đưa ra trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, bảng B.1. Nó có thể xảy ra rằng một khu vực là trống rỗng, có nghĩa là không có hệ số băng con từ mức độ phân giải có liên quan thực sự đóng góp vào các khu vực. Điều này có thể xảy ra, ví dụ, ở phía dưới bên phải của một thành phần khối ảnh do mẫu đối với lưới tài liệu tham khảo. Khi điều này xảy ra, mỗi gói tương ứng với khu vực mà vẫn phải xuất hiện trong dòng mã (xem Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, B.9).
I.2.2 Phân chia các băng con thành khối mã
Khoản mục này sửa đổi Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, B.7. Hai câu sau đây liên quan đến phân vùng khối mã cần thay thế hiện diện trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, B.7, theo phương trình B-19. Giống như các khu vực, phân vùng khối mã được neo tại (zx, zy), như minh chúng trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, Hình I.2. Vì vậy tất cả các hàng đầu tiên của mã-khối khối mã phân vùng được đặt tại y = zy + m · 2ycb‘ và tất cả các cột đầu tiên của mã-khối được đặt tại x = zx + n · 2xcb‘, ở đó m và n là các số nguyên.
Hình I.2 – Khối mã và các khu vực trong băng con b từ bốn khối ảnh khác nhau
I.2.3 Mức độ phân giải – định vị – thành phần – tiến trình
Khoản mục phụ này thay thế Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, B.12.1.3. Độ phân giải cấp vị trí – tiến triển lớp thành phần được định nghĩa là cách các gói dữ liệu theo thứ tự sau:
Cho mỗi r = 0, … , Nmax
Cho mỗi y = ty0,…, ty1-1,
Cho mỗi x = tx0,…, tx1-1,
Cho mỗi i = 0,…, Csiz-1
Nếu ((y – zy) chia hết cho YRsiz(i) · 2PPy(r, i)+NL(i)-r) hoặc ((y = ty0) và ((try0 – zy)·2NL(i)-r không chia hết cho 2PPy(r, i)+NL(i)-r))
Nếu ((x – zx) chia hết cho XRsiz(i)·2PPx(r, i)+NL(i)–r) hoặc ((x = tx0) và ((trx0 – zx)·2NL(i)-r không chia hết cho 2PPy(r, i)+NL(i)-r))
cho khu vực tiếp theo, k, nếu có,
Cho mỗi I = 0, … , L-1
gói cho thành phần i, độ phân giải r, lớp I, và khu vực k.
Trong các phần trên, k có thể được lấy từ:
I.2.4 Định vị – thành phần – mức độ phân giải – lới tiến trình
Khoản mục này thay thế Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, B.12.1.4. Vị trí thành phần độ phân giải cấp lớp tiến triển được định nghĩa là cách các gói dữ liệu theo thứ tự sau:
Cho mỗi y = ty0, …, ty1-1,
Cho mỗi x = tx0,…, tx1-1,
Cho mỗi i = 0,…, Csiz-1
Cho mỗi r = 0, … , NL Khi NL là số mức phân tách cho thành phần i,
((y – zy) chia hết cho YRsiz(i) · 2PPy(r, i)+NL(i)-r) HOẶC ((y = ty0) VÀ (try0 –zy)·2NL(i)–r
KHÔNG chia hết cho 2PPy(r, i)+NL(i)-r))
nếu ((x – zx) chia hết cho XRsiz(i) · 2PPx(r, i)+NL(i)-r) HOẶC ((x = tx0) VÀ ((trx0 – zx)·2NL(i)-r KHÔNG chia hết cho 2PPx(r, i)+NL(i)-r))
cho khu vực tiếp theo, k, nếu có, theo trình tự thể hiện trong hình I.1
Cho mỗi I = 0,…, L-1
gói cho thành phần i, độ phân giải r, lớp I, và khu vực k.
Trong các bên trên, k có thể được lấy từ phương trình I-7. Để sử dụng tiến triển này, XRsiz và YRsiz các giá trị sẽ là mũ hai cho mỗi thành phần. Một sự tiến triển của loại hình này có thể là hữu ích trong việc cung cấp độ chính xác cao mẫu cho một vị trí không gian cụ thể trong tất cả các thành phần.
I.2.5 Thành phần – đinh vị – mức độ phân giải – lới tiến trình
Khoản mục này này thay thế Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, B.12.1.5. Vị trí- thành phần giải quyết cấp lớp tiến triển được định nghĩa là cách các gói dữ liệu theo thứ tự sau:
Cho mỗi i = 0, …, Csiz-1,
Cho mỗi y = ty0,…, ty1-1,
Cho mỗi x = tx0,…, tx1-1,
Cho mỗi r = 0, … , NL Khi NL là số mức phân tách cho thành phần i,
((y – zy) chia hết cho YRsiz(i)·2PPy(r, i)+NL(i)-r) HOẶC ((y = ty0) VÀ (try0 –zy)·2NL(i)–r
KHÔNG chia hết cho 2PPy(r, i)+NL(i)-r))
nếu ((x – zx) chia hết cho XRsiz(i)·2PPx(r, i)+NL(i)-r) HOẶC ((x = tx0) VÀ ((trx0 – zx)·2NL(i)-r KHÔNG chia hết cho 2PPx(r, i)+NL(i)-r))
cho khu vực tiếp theo, k, nếu có, theo trình tự thể hiện trong hình I.1
Cho mỗi I = 0,…, L-1
Gói cho thành phần i, độ phân giải cấp r, lớp I, và khu vực k. Trong các phần trên, k có thể được lấy từ phương trình I-7. Một sự tiến triển của loại hình này có thể là hữu ích trong việc cung cấp độ chính xác cao cho một vị trí không gian cụ thể trong một thành phần ảnh cụ thể.
I.3 Mở rộng SSO
Khoản mục này chỉ áp dụng nếu phần mở rộng SSO được chọn n. Việc lựa chọn của phần mở rộng SSO báo hiệu trong các mở rộng COD và COC dấu hiệu (xem A.2.3) và chỉ được áp dụng cho WS biến đổi sóng (ví dụ, Filt_Cat = WS). Các tham số có liên quan đến việc gia hạn SSO XC, YC được báo hiệu trong đoạn mở rộng đánh dấu COD và COC.
I.3.1 Biến đổi sóng con rời rạc thuận nghịch chồng lấn mẫu riêng biệt (SSO-IDWT)
Lựa chọn của phần mở rộng SSO yêu cầu sửa đổi các 1D_FILTR_WS thủ tục lọc mô tả trong G.2.2.2 (thủ tục 1D_FILTR_SSO), cũng như một biến thể của IDWT, 2D_SR, HOR_SR, VER_SR và 1D_SR thủ tục được mô tả trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, F.3: các thủ tục IDWT_SSO, 2D_SR_SSO, HOR_SR_SSO, VER_SR_SSO và 1D_SR_SSO. Các cải biến được chỉ định trong mục con này.
I.3.1.1 Thủ tục IDWT_SSO
Thủ tục IDWT_SSO (minh chúng a trong hình I.3) bắt đầu với khởi tạo của các biến lev (mức phân tách hiện tại) đến NL, của biến to và biến đến , trong đó XC và YC được cho trước trong đánh dấu COD/COC, trong phần bù SSO.
Các thủ tục 2D_SR_SSO (được mô tả trong I.3.1.2) được thực hiện tại mọi cấp lev, trong đó lev giảm lặp đi lặp lại, cho đến khi lặp đi lặp lại được thực hiện. Thủ tục 2D_SR_SSO lặp trên levLL, levLX hoặc levXL băng con tạo ra mỗi lặp đi lặp lại. Cuối cùng, băng con a0LL (u0LL, v0LL) là đầu ra ma trận I(x, y).
Hình I.3 – Thủ tục IDWT_SSO
I.3.1.2 Thủ tục 2D_SR_SSO
Thủ tục 2D_SR_SSO là giống hệt nhau đối với các thủ tục 2D_SR được mô tả trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, F.3.2, ngoại trừ việc bổ sung các tham số XCIev, YCIev (xem hình I.4), mà tương ứng được sử dụng bởi các thủ tục HOR_SR_SSO và VER_SR_SSO (xem I.3.1.3 và I.3.1.4). Quy trình 2D_SR_SSO sử dụng các thủ tục 2D_INTERLEAVE được chỉ định trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1.
Hình I.4 – Thủ tục 2D_SR_SSO
I.3.1.3 Thủ tục HOR_SR_SSO
Thủ tục HOR_SR_SSO là giống hệt nhau để các HOR_SR thủ tục được mô tả trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, F.3.4, ngoại trừ việc bổ sung các tham số xC, được sử dụng bởi các thủ tục 1D_SR_SSO (xem I.3.1.5).
I.3.1.4 Thủ tục VER_SR_SSO
Thủ tục VER SR_SSO là giống hệt nhau để các VER_SR thủ tục được mô tả trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, F.3.5, ngoại trừ việc bổ sung các tham số yC, được sử dụng bởi các thủ tục 1D_SR_SSO (xem I.3.1.5).
I.3.1.5 Thủ tục 1D_SR_SSO
Thủ tục 1D_SR_SSO là giống hệt nhau để các 1D_SR thủ tục được mô tả trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, F.3.6, ngoại trừ việc bổ sung các tham số dC (mà là một đầu vào cho các thủ tục 1D_FILTR_SSO) và thay thế các thủ tục 1D_FILTR bởi các thủ tục 1D_FILTR_SSO (xem I.3.1.6). DC tham số là một trong hai tham số xC (nếu được gọi là các thủ tục HOR_SR_SSO) hoặc yC tham số (nếu được gọi là các thủ tục VER_SR_SSO).
I.3.1.6 Thủ tục 1D_FILTR_SSO
Thủ tục 1D_FILTR_SSO là một sửa đổi của các 1D_FlLTR_WS thủ tục được mô tả trong G.2.2.2. Các tham số đầu vào và đầu ra của các thủ tục 1D_FILTR_SSO được đưa ra trong chuyển I.5.
Hình I.5 – thông số của thủ tục 1D_FILTR_SSO
Để k0 được định nghĩa bởi:
(I-8)
Và N| được định nghĩa bởi
(I-9)
Chia nhỏ khoảng [i0, i1 – 1] thành N| đoạn Ip = [np, np + 1] (p = 0, 1,…, N| – 1), trong đó np được định nghĩa bởi:
n0 = i0, nNJ = i1 – 1 and np = (k0 + p)dC for p = 1,…, NI – 1 (I-10)
Đối với chỉ số ilp, xác định hàm PSEO p(i) như:
PSEO,p (i) = PSEO (i, np, np+1 + 1) (I-11)
Trong đó hàm PSEO(i, i0, i1) được định nghĩa bởi Khuyến nghị T.800 of ITU| tiêu chuẩn ISO/IEC 15444-1, phương trình F-4.
I.3.1.6.1 Biến đổi thuận nghịch
Khoản mục này chỉ định cho biến đổi đảo ngược các sửa đổi của mỗi bước nâng s theo quy định trên phương trình G-2. Sửa đổi của phương trình G-2 đảm bảo rằng mỗi hệ số V (2n + ms) được tính độc quyền từ hệ số chỉ số trong đó thuộc về khoảng thời gian cùng một Ip là 2n + bà tại mỗi nâng bước, tất cả các giá trị V(np) cho {np|mod (np, dC) = 0; p = 0, 1,…, NI} nếu có, vẫn chưa sửa đổi, trong khi tất cả các giá trị V (2n + ms) (tức là, cho mà 2n + ms thuộc về một khoảng thời gian duy nhất Ip) được sửa đổi theo phương trình I-12:
I.3.1.6.2 Biến đổi không thuận nghịch
Khoản mục này chỉ định cho phép biến đổi không thể đảo ngược những sửa đổi của mỗi bước nâng s theo quy định trong phương trình G-6. Các bước tỉ lệ được chỉ định trong phương trình G-4 và G-5 được không thay đổi. Các sửa đổi của phương trình G 6 đảm bảo rằng mỗi hệ số V (2n + ms) được tính độc quyền từ hệ số chỉ số trong đó thuộc về khoảng thời gian cùng một Ip là 2n + bà tại mỗi nâng bước, tất cả các giá trị V(np) cho {np|mod (np, dC) = 0; p = 0, 1,…, NI}, nếu có, được sửa đổi theo phương trình I-13:
V(np) = (1 / BS)V(np) (I-13)
ở đó BS được định nghĩa trong công thức G-1, trong khi tất cả các giá trị khác V(2n + ms) (Ví dụ, mà 2n + mS thuộc về một khoảng duy nhất Ip) được sửa đổi theo phương trình I-14:
I.3.2 Biến đổi sóng con rời rạc hướng thuận chồng lấn mẫu riêng biệt (thông tin)
Lựa chọn của phần mở rộng sso yêu cầu sửa đổi các 1D_FILTD_WS lọc thủ tục mô tả trong G.3.2 (thủ tục 1D_FILTD_SSO), cũng như một biến thể của FDWT, 2D_SD, HOR_SD, VER_SD và 1D_SD thủ tục quy định tại Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, F.4 (FDWT_SSO, 2D_SD_SSO, HOR_SD_SSO, VER_SD_SSO và 1D_SD_SSO). Các thủ tục sửa đổi được quy định trong khoản mục này.
I.3.2.1 Thủ tục FDWT_SSO
Thủ tục FDWT_SSO (minh chúng a trong hình I.6) bắt đầu với khởi tạo của Lev (hiện nay là phân hủy mức) biến 1, XC1 biến để XC và YC1 biến để YC, trong đó XC và YC được đưa ra trong điểm đánh dấu COD/COC (xem bảng A.9). Các thủ tục 2D_SD_SSO (được mô tả trong I.3.1) được thực hiện tại mọi cấp Lev, trong đó Lev cấp tăng lên tại mỗi lặp đi lặp lại, cho đến khi NL lặp đi lặp lại được thực hiện.
Hình I.6 – Thủ tục FDWT_SSO
I.3.2.2 Thủ tục 2D_SD_SSO
Thủ tục 2D_SD_SSO là giống hệt nhau để 2D_SD thủ tục quy định tại Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, F.4.2, ngoại trừ việc bổ sung các tham số XClev, YClev (xem hình I.7), mà tương ứng được sử dụng bởi các thủ tục HOR_SD_SSO và VER_SD_SSO (xem I.3.2.3 và I.3.2.4).
I.3.2.3 Thủ tục HOR_SD_SSO
Thủ tục HOR_SD_SSO là giống hệt nhau để thủ tục HOR_SD được chỉ định trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, F.4.4, ngoại trừ việc bổ sung các tham số xC, được sử dụng bởi các thủ tục 1D_SD_SSO (xem I.3.1).
I.3.2.4 Thủ tục VER_SD_SSO
Thủ tục VER_SD_SSO là giống hệt nhau để thủ tục VER_SD được chỉ định trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, F.4.3, ngoại trừ việc bổ sung các tham số yC, được sử dụng bởi các thủ tục 1D_SD_SSO (xem I.3.1).
Hình I.7 – Thủ tục 2D_SD_SSO
I.3.2.5 Thủ tục 1D_SD_SSO
Thủ tục 1D_SD_SSO là giống hệt nhau để thủ tục 1D_SD được chỉ định trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, F.4.6, ngoại trừ việc bổ sung các tham số dC (mà là một đầu vào cho các thủ tục 1D_FILTD_SSO) và thay thế các thủ tục 1D_FILTD_WS bởi các thủ tục 1D_FILTD_SSO (xem I.3.2.6). DC tham số là một trong hai tham số xC (nếu được gọi là các thủ tục HOR_SD_SSO) hoặc yC tham số (nếu được gọi là các thủ tục VER_SD_SSO).
I.3.2.6 Thủ tục 1D_FILTD_SSO
Thủ tục 1D_FILTD_SSO là một sửa đổi của các 1D_FILTD_WS thủ tục được mô tả trong G.2.2.2. Các tham số đầu vào và đầu ra của các thủ tục 1D_FILTD_SSO được đưa ra trong hình I.8.
I.3.2.6.1 Biến đổi thuận nghịch
Khoản mục này chỉ định cho biến đổi đảo ngược các sửa đổi của mỗi bước nâng s theo quy định trong phương trình G-8. Sửa đổi của phương trình G-8 đảm bảo rằng mỗi hệ số V (2n + ms) được tính độc quyền từ hệ số chỉ số trong đó thuộc về khoảng thời gian cùng một Ip là 2n + ms như là một hệ quả, tại mỗi bước nâng, tất cả các giá trị V(np) với {np\mod (np, dC) = 0; p = 0, 1,…, NI}, nếu có, vẫn chưa sửa đổi, trong khi tất cả các giá trị khác V (2n + ms) (tức là 2n + ms thuộc về một khoảng thời gian duy nhất Ip) được sửa đổi theo phương trình I-15:
I.3.2.6.2 Biến đổi không thuận nghịch
Khoản mục này chỉ định cho phép biến đổi không thể đảo ngược những sửa đổi của mỗi bước nâng s theo quy định trong phương trình G 9. Các sửa đổi của phương trình G 9 đảm bảo rằng mỗi hệ số V (2n + ms) được tính độc quyền từ hệ số chỉ số trong đó thuộc về khoảng thời gian cùng một Ip là 2n + ms tại mỗi bước nâng, tất cả các giá trị V(np) với {np\mod (np, dC) = 0; p = 0, 1,…, NI}, nếu có, được sửa đổi theo phương trình I-16:
V(np) = BsV(np) (I-16)
Trong đó Bs được định nghĩa trong phương trình G-1, trong khi tất cả các giá trị V (2n + ms) (tức là, cho mà 2n + ms thuộc về một khoảng thời gian duy nhất Ip) được sửa đổi theo phương trình I-17:
Các bước tỉ lệ được chỉ định trong phương trình G-10 và G-11 không được thay đổi.
Hình I.8 Các tham số của thủ tục 1D_FILTD_SSO
I.3.3 Lựa chọn các tham số chồng lấn mẫu riêng biệt (thông tin)
Việc lựa chọn của phần mở rộng SSO cho phép một bộ nhớ thấp dựa trên khối thực hiện của các biến đổi sóng, cả hai phía trước và hướng ngược: ví dụ, sự Biến đổi về phía trước có thể được áp dụng một cách độc lập cho SSO khối mẫu chiết xuất từ các thành phần khối ảnh ảnh. Các tham số có liên quan đến việc lựa chọn của phần mở rộng SSO: XC, YC, zx và zy (xem I.2.2).
I.3.3.1 Phân chia các thành phần khối ảnh thành các khối SSO chồng lấn (thông tin)
SSO khối có chiều rộng XC + 1 và chiều cao YC + 1 thuộc phạm vi thành phần khối ảnh. Dòng đầu tiên và cuối cùng của một khối SSO luôn luôn được đặt tại các bội số của YC, trong khi các cột đầu tiên và cuối cùng của một khối SSO luôn luôn được đặt tại các bội số của XC (xem hình H.7). Hai nước láng giềng SSO khối chồng lên nhau của một trong hai hàng một mẫu (dọc kề nhau), một cột của mẫu (ngang kề nhau), hoặc chỉ là một mẫu (chéo kề nhau).
I.3.3.2 Lựa chọn các tham số khối ảnh (thông tin)
Để tối đa hóa hiệu quả mã hóa, nên việc lựa chọn khối ảnh thông số sau đây: mod (XTsiz, XC) = 0 và mod (YTsiz, YC) = 0. Để tối đa hóa hiệu quả của bộ nhớ, khuyên lựa chọn sau đây của mã hóa thông số: XTOsiz = zx, YTOsiz = zy.
I.3.4 Ví dụ SSO (thông tin)
I.3.4.1 Minh họa trong trường hợp biến đổi thuận nghịch hướng thuận 5-3 (thông tin)
Bước nâng thứ nhất là:
Bước nâng thứ hai là:
Hình I.9 – Vị trí của khối SSO
I.3.4.2 Minh họa trong trường hợp biến đổi không thuận nghịch hướng thuận 5-3 (thông tin)
Bước nâng thứ nhất là:
Bước nâng thứ hai là:
I.3.4.3 Minh họa trong trường hợp biến đổi không thuận nghịch hướng thuận 9-7 (thông tin)
Bước nâng thứ nhất là:
Bước nâng thứ hai là:
Bước nâng thứ ba là:
Bước nâng thứ tư là:
Các bước tiếp theo giống nhau cho tất cả các hệ số.
I.4 Phần mở rộng TSSO
Khoản mục này áp dụng chỉ nếu phần mở rộng TSSO được chọn n. Việc lựa chọn của phần mở rộng TSSO cho phép việc sử dụng khối ảnh mà không có bất kỳ có thể nhìn thấy ở ranh giới của khối ảnh. Các khối ảnh phải chồng lên nhau, nhưng do một hàng và chỉ một cột.
I.4.1 Báo hiệu cho TSSO
Việc lựa chọn của phần mở rộng TSSO báo hiệu trong các mở rộng COD và dấu hiệu COC (xem A.2.3). Nếu SSODWT được sử dụng với TSSO, sau đó chỉ biến đổi sóng (đảo ngược hoặc không thể đảo ngược) mà sử dụng WS bộ lọc sóng (ví dụ, Filt_cat = WS) có thể được sử dụng. Các tham số có liên quan đến việc lựa chọn của phần mở rộng TSSO XTsiz, YTsiz được báo hiệu trong kích mở rộng phân đoạn nhãn (xem Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, A.5.1), trong khi các tham số Hovlp và Vovlp được báo hiệu trong tham số SSO của nhà tạo ra COD (xem bảng A.11 của A.2.3).
I.4.2 Phân chia ảnh thành các khối ảnh chồng lấn mẫu riêng biệt
Phân vùng khối ảnh được xác định trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1 là giống hệt nhau, ngoại trừ những khác biệt này.
Phương trình B-7, B-8, B-9 và B-10 từ Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1 phải được sửa đổi như sau:
Khối ảnh có chiều rộng tx1 (p, q) – tx0(p, q) = XTsiz + 1 và chiều cao ty1(p q)-ty0 (p, q) = YTsiz + 1. Chúng chồng lên nhau của một cột và hàng như minh họa trong hình I.10 trong trường hợp của Hovlp = Vovlp = 0. Các tham số Hovlp và Vovlp có thể có giá trị là 0 hoặc 1.
Hình I.10 – Phân khối ảnh của sơ đồ lưới tham chiếu
Tham số khối ảnh XTsiz và YTsiz phải đáp ứng các phương trình sau đây:
mod(XTsiz, Rx·2) = 0 and mod(YTsiz, Ry·2) = 0 (I-50)
Trong đó Rx và Ry là bội số chung thấp nhất của phụ mẫu yếu tố XRsizi và YRsizi. Độ lệch khối ảnh XTOsiz và YTOsiz phải đáp ứng phương trình sau đây:
mod(XTOsiz, Rx · 2) = 1– Hovlp and mod(YTOsiz, Ry · 2) = 1 – Volvp. (I-51)
Cuối cùng, phần mở rộng TSSO phải được sử dụng cho tất cả các khối ảnh thành.
I.4.3 Phục dựng các mẫu ảnh từ các khối ảnh đã được phục dựng lại
Kể từ khi khối ảnh dựng lại chồng lên nhau của một hàng và một cột với khối ảnh liền kề, một số ảnh mẫu sẽ được tái tạo một cách riêng biệt trong hai hoặc bốn khối ảnh khác nhau. Đối với bất kỳ mẫu như vậy, một phải sử dụng các quy tắc sau đây. Nếu một mẫu được xây dựng lại từ nhiều hơn một khối ảnh, sau đó mẫu được sử dụng để xây dựng lại là giá trị mẫu từ khối ảnh nếu trái Hovlp = 0 và giá trị mẫu từ khối ảnh đúng nếu Hovlp = 1, các giá trị mẫu từ khối ảnh để đầu nếu Vovlp = 0 và giá trị mẫu từ khối ảnh dưới cùng nếu Hovlp = 1.
I.5 Kết hợp các phần mở rộng SSO và TSSO (thông tin)
Có thể sử dụng phần mở rộng SSO kết hợp với phần mở rộng TSSO. Khi điều này xảy ra, các thủ tục lọc được mô tả trong I.3 được áp dụng cho mỗi ngói chồng chéo một cách riêng biệt. Khi XTsiz và YTsiz là bội số của XC, YC tương ứng, cho ví dụ XC = XTsiz và YC = YTsiz, các giá trị xây dựng lại tại chồng chéo khối ảnh ranh giới sẽ không thay đổi dựa trên khối ảnh, do đó, các quy tắc được mô tả trong I.4.3 là dự phòng, Khi XTsiz và YTsiz không phải là bội số của XC, YC tương ứng, sau đó các quy tắc cho việc lựa chọn xây dựng lại mẫu giá trị trong I.4.3 áp dụng như được mô tả.
Hơn nữa, để cải thiện bộ nhớ hiệu quả, lựa chọn sau đây của mã hóa thông số khuyến khích: XTOsiz = zx, YTOsiz = zy.
Phụ lục J
(Quy định)
Biến đổi nhiều thành phần, phần mở rộng
(Phụ lục là phần tích hợp với tiêu chuẩn)
Trong phụ lục này và các điều nhỏ của phụ lục, các biểu đồ và bảng chỉ có tính quy định trong trường hợp chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này mô tả một phần mở rộng trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1 có thể được sử dụng đơn thuần hoặc kết hợp với bất kỳ của các phần mở rộng khác trong tiêu chuẩn này, ngoại trừ những mặt hàng trong phụ lục b Khả năng của dòng mã được xác định bởi tham số phân đoạn nhãn kích Rsiz (xem A.2.1). DC cấp chuyển khối ảnh -thành phần được mô tả trong phụ lục G của Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1 không được thực hiện khi sử dụng bất kỳ thủ tục Biến đổi nhiều thành phần trong phụ lục này. Thủ tục tồn tại trong phụ lục này mà có thể được sử dụng thay cho các DC cấp chuyển được mô tả trong Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1.
J.1 Giới thiệu khái niệm biến đổi nhiểu thành phần
Phụ lục này xác định biến đổi nhiều thành phần. Ứng dụng chung nhất biến đổi nhiều thành phần là nén ảnh màu. Tiêu chuẩn ảnh màu (RGB) được chuyển thành một không gian màu lợi hơn cho không gian nén (ví dụ, YIQ). Kỹ thuật này có thể được mở rộng cho ảnh có thêm nhiều thành phần; Ví dụ, ảnh LVÀSAT có bảy thành phần, sáu trong đó có rất tương quan. Nó cũng có thể được sử dụng cho việc nén ảnh CMYK, ảnh nhiều thành phần trong y tế, và dữ liệu thành phần nhiều khác bất kỳ.
Có hai kỹ thuật biến đổi nhiều thành phần trình bày trong phụ lục này. Việc đầu tiên là một ma trận dựa trên biến đổi nhiều thành phần tạo thành tổ hợp tuyến tính của các thành phần để giảm các mối tương quan của mỗi thành phần. Cấu trúc biến đổi này cho phép các biến đổi dự đoán thành phần như DPCM, và bao gồm biến đổi phức tạp hơn như chuyển đổi Karhunen-Loèvè (KLT). Những biến đổi dựa trên ma trận có thể được thực hiện hướng ngược hoặc không hướng ngược. Thứ hai, kỹ thuật biến đổi nhiều thành phần là một biến đổi sóng con dựa trên không tương quan. Chuyển đổi dựa trên sóng con cũng có thể được thực hiện hướng ngược hoặc không hướng ngược. Phụ lục này cung cấp một cơ chế linh hoạt cho phép các kỹ thuật được sử dụng trong trình tự, nếu mong muốn, ví dụ như, một chuyển đổi dựa trên ma trận sau đấy là một biến đổi dựa trên sóng con. Hơn nữa, phụ lục này cung cấp cơ chế cho phép các thành phần để sắp xếp lại và chia thành tập hợp các thành phần.
Tập hợp các thành thành phần có thể được hình thành để nhóm các thành phần với nhau với tính chất thống kê tương tự để nâng cao hiệu quả nén một biến đổi nhiều thành phần. Các tập hợp cũng có thể được sử dụng để làm giảm sự phức tạp tính toán của biến đổi thành phần thông qua việc tách một biến đổi thành phần lớn liên quan đến nhiều thành phần vào một số biến đổi của kích thước nhỏ hơn. Thường xuyên chia tách như vậy có thể được thực hiện với ít mất trong thực hiện nén. Các tổ hợp các thành phần cũng cho phép các ứng dụng biến đổi dựa trên ma trận và biến đổi dựa trên sóng con, trên tập hợp khác nhau, trong cùng một dòng mã nén.
Có thể sử dụng các kỹ thuật trong phụ lục này để tạo ra nhiều hơn hoặc ít hơn thành phần đầu ra (dựng lại ảnh) so với số lượng các thành phần mã hóa trong dòng mã. Điều này cho phép mã hóa để biến đổi thành phần ảnh ban đầu thành một miền mới và loại bỏ những thành phần biến đổi có chứa ít hoặc không có thông tin trước khi tạo ra dòng mã nén. Các bộ mã hóa Tuy nhiên có thể hướng dẫn một bộ giải mã trên một cách thích hợp để tạo lại một xấp xỉ cho các thành phần ban đầu được đưa ra chỉ có bộ giảm dòng mã thành phần. Một bộ mã hóa cũng có thể sử dụng trình biến đổi nhiều thành phần để cung cấp chức năng như các thế hệ của pseudo-màu hoặc màu xám lồng vào cốt của một ảnh nhiều thành phần.
Các kỹ thuật được mô tả trong phụ lục này là rất mạnh và có thể phục vụ nhiều công dụng khác nhau. Phụ lục này không quy định làm thế nào để áp dụng các kỹ thuật cho một ảnh nhiều thành phần để tăng hiệu suất nén; không phải nó mô tả nhiều ứng dụng có thể của các kỹ thuật này. Một ví dụ chi tiết được bao gồm trong O.3 mà cố gắng để minh họa một số tính linh hoạt của chúng. Thủ tục được định nghĩa trong phụ lục này mà nghiêm chỉnh kiểm soát việc sử dụng các kỹ thuật biến đổi nhiều thành phần. Những quy trình này đảm bảo rằng bất kỳ giải mã phù hợp với phụ lục này sẽ thành công giải mã được hình thành đúng dòng mã sử dụng các kỹ thuật này. Như với bất kỳ bộ công cụ mạnh mẽ, nó là khá dễ dàng để làm cho lỗi không mong đợi, và chăm sóc tuyệt vời nên được thực hiện trong tôn trọng các thủ tục của phụ lục này trong ứng dụng của nhiều biến đổi thành phần.
J.2 Tổng quan về xử lý thuận nghịch
Một đặc tính mạnh mẽ của này phụ lục biến đổi nhiều thành phần nằm trong khả năng chứa nhiều kỹ thuật không tương quan trong cùng một khuôn khổ và cho phép xây dựng lại bằng cách sử dụng một bộ giải mã tổng quát. Xây dựng lại trong trường hợp này bao gồm biến đổi hướng ngược dec Hoặc relation (ví dụ như KLT, vv), biến đổi hướng ngược phụ thuộc (ví dụ, tuyến tính dự báo, vv) và biến đổi hướng ngược chiều sóng con. Hình J.1, J.3 và J.5 minh chúng a hướng ngược nhiều Biến đổi thành phần chế biến các bước cần thiết để tái tạo lại ảnh các thành phần từ dòng mã.
Hướng ngược nhiều thành phần Biến đổi bao gồm một loạt các giai đoạn biến đổi. Trong từng giai đoạn, tập hợp các thành phần đầu vào có sẵn, được gọi là thành phần trung gian, có thể được chia thành các tập hợp thành phần, mỗi trong số đó có thể được Biến đổi với một phương pháp Biến đổi khác nhau. Phần còn lại của khoản mục này cung cấp các chi tiết liên quan đến bộ giải mã hành động và vị trí của các thông tin cần thiết trong dòng mã. Khoản mục này không giải quyết các phương trình áp dụng cho các ứng dụng của một Biến đổi nhất định. Thay vào đó, cá nhân nhiều thành phần biến đổi được gọi đến tổng quát trong khoản mục này và được chi tiết trong J.3.
Các điểm phân đoạn nhãn truyền đạt thông tin nhiều Biến đổi thành phần. Cho hai của các phân đoạn nhãn, MCT và MCC (xem A.3.7 và A.3.8), nó là có thể rằng số lượng dữ liệu cần thiết sẽ lớn hơn số tiền tối đa của dữ liệu được cho phép trong một phân đoạn duy nhất đánh dấu. Nếu nhiều điểm phân đoạn nhãn là cần thiết để truyền tải dữ liệu trong một phân đoạn nhãn MCT hoặc MCC, dữ liệu được chia thành hai hoặc nhiều điểm đánh dấu phân đoạn. Có thể rằng một dòng mã có thể chứa nhiều loạt phân đoạn nhãn trong một tiêu đề phần khối ảnh chính hoặc đầu tiên. Chỉ số phân đoạn nhãn (Imct hoặc Imcc) lặp đi lặp lại trong mỗi phân khúc đánh dấu trong bộ này. Các dữ liệu trong một loạt các điểm phân đoạn nhãn với cùng một điểm phân đoạn nhãn index (lmct hoặc Imcc) được nhóm lại với nhau. Các loạt toàn bộ các điểm phân đoạn nhãn sẽ được tìm thấy trong cùng một tiêu đề, tiêu đề chính hoặc tiêu đề phần khối ảnh đầu tiên.
Một trường trong mỗi của các dấu hiệu (Ymct hoặc Ymcc) cho biết tổng số phân đoạn nhãn được sử dụng để truyền đạt thông tin Biến đổi kết hợp với rằng chỉ số phân đoạn đặc biệt đánh dấu (Imct hoặc Imcc). Một trường thứ hai (Zmct hoặc Zmcc) chỉ ra vị trí của một phân đoạn đặc biệt đánh dấu tương đối so với tất cả những người khác trong cùng một tiêu đề chia sẻ mục đánh dấu. Khi Biến đổi thông tin được phân phối trên nhiều hơn một điểm đánh dấu phân đoạn, các tham số liệt kê từ các điểm phân đoạn nhãn được nối byte-wise theo thứ tự tăng Zmcc hoặc Zmct. Khi nối như vậy hoàn thành, dòng kết quả của tham số sau đó đối xử như thể nó đã được truyền đi trong một phân đoạn duy nhất đánh dấu. Các văn bản sau đó giả định rằng bất kỳ như vậy nối yêu cầu phân đoạn nhãn nội dung đã được thực hiện.
J.2.1 Biến đổi nhiều thành phần thuận nghịch (MCO_TRANSF HOẶC M)
Như minh họa trong hình J.1, hướng ngược nhiều thành phần Biến đổi là một biến mất như là đầu vào của nó tập hợp trong không gian xây dựng lại các thành phần từ dòng mã tạo bởi hai chiều sóng con hướng ngược biến đổi và tạo ra một tập hợp các thành phần dựng lại ảnh. Mỗi mẫu thành phần nhiều xây dựng lại bằng cách áp dụng các bước xử lý như được chỉ ra trong dòng mã. Quá trình Biến đổi hướng ngược được thực hiện trong một loạt các bước được gọi là giai đoạn biến đổi. Đánh dấu MCO phân đoạn (xem phụ lục A.3.9) áp dụng cho khối ảnh nhất định chứa thông tin về mỗi người trong số những giai đoạn. Đặc biệt, trường Nmco đoạn MCO đánh dấu cho số lượng các giai đoạn Biến đổi sẽ được áp dụng trong xử lý hướng ngược.
Hình J.1 – Xử lý Biến đổi hướng ngược nhiều thành hướng ngược
Nếu Nmco = 0 cho một khối ảnh, sau đó không có hướng ngược nhiều thành phần Biến đổi được thực hiện trên khối ảnh này và các thành phần dựng lại ảnh jth được đưa ra bởi các thành phần jth trong không gian xây dựng lại nhất. Trong trường hợp này, khối ảnh được xử lý như nếu không có biến đổi nhiều thành phần trong sử dụng. DC cấp chuyển khối ảnh -thành phần được mô tả trong phụ lục G của Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1 được thực hiện. Phân khúc đánh dấu CBD, là cần thiết với nhiều thành phần biến đổi, vẫn còn áp dụng cho khối ảnh mà Biến đổi thành phần nhiều đã bị tắt. Trong thực tế đoạn đánh dấu CBD áp dụng cho tất cả các khối ảnh trong một ảnh mà sử dụng nhiều thành phần biến đổi. Vì có thể có các biến đổi khác nhau sử dụng trong khối ảnh khác nhau, các phân đoạn nhãn CBD phải được xây dựng để phù hợp với độ sâu bit lớn nhất được tìm thấy trong tất cả các khối ảnh cho một thành phần nhất định.
Khi một Biến đổi được thực hiện, kth trường Imco của đoạn MCO đánh dấu có chứa chỉ số của MCC phân đoạn nhãn (xem A.3.8) áp dụng cho giai đoạn kth của biến đổi hướng ngược. Nó khuyến khích, nhưng không bắt buộc, bộ giải mã hoàn thành tất cả xử lý trong một giai đoạn nhất định của sự Biến đổi ngược trước khi bắt đầu giai đoạn tiếp theo. (Có thể một bộ giải mã thông minh có thể để xác định chỉ những bước xử lý cần thiết để tạo ra một tập hợp của các thành phần dựng lại ảnh. Tuy nhiên, hoàn thành tất cả xử lý trong một giai đoạn trước khi tiếp tục kế tiếp đảm bảo giải mã chính xác của dòng mã.) Một sơ đồ tương ứng với các hoạt động đó sẽ dẫn đến việc áp dụng thành công các hướng ngược nhiều thành phần Biến đổi được thể hiện trong hình J.2. Việc xử lý bao gồm việc áp dụng các thủ tục MCC_TRANS cho mỗi người trong các giai đoạn Biến đổi chỉ ra trong phân khúc đánh dấu MCO.
Hình J.2 – Thủ tục MCO_TRANSF HOẶC M
Cơ chế biến đổi nhiều thành phần không đặt giới hạn trên độ sâu bit của các thành phần dựng lại ảnh. Hơn nữa, nó có thể cho số lượng các thành phần trong không gian dựng lại khác với số lượng các thành phần dựng lại ảnh. Vì vậy, khi sử dụng cơ chế nhiều Biến đổi thành phần, một phân đoạn nhãn CBD (xem A.3.6) sẽ được sử dụng. Phân khúc đánh dấu này cho thấy tổng số đầu ra ảnh thành phần và độ sâu bit tương ứng của chúng sau khi hướng ngược nhiều thành phần Biến đổi được áp dụng. Chỉ có một trung tâm thành phố phân đoạn nhãn có thể xuất hiện trong tiêu đề chính của dòng mã. Do đó tất cả các khối ảnh trong một ảnh phải chứa cùng một số thành phần, và độ sâu bít thành phần trong phân khúc đánh dấu CBD phải độ đủ để trang trải độ sâu bit tối đa của một thành phần trên tất cả các khối ảnh.
Khi nhiều thành phần Biến đổi xử lý được sử dụng, các phân đoạn nhãn kích (xem A.2,1) sẽ cho biết số và bit độ sâu của các thành phần trong dòng mã sau khi biến đổi hướng ngược hai chiều sóng con. Nói cách khác, các phân đoạn nhãn kích chỉ ra độ sâu bít của thành phần dòng mã sau khi về phía trước nhiều thành phần biến đổi. Điều này giải thích các phân đoạn nhãn kích là tinh tế khác nhau từ của nó giải thích trong quá trình giải mã khác trong đề nghị này | Tiêu chuẩn quốc tế và Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1, trong đó nó được sử dụng để chỉ số lượng đầu ra ảnh thành phần và độ sâu bít của chúng.
J.2.2 Tầng Biến đổi nhiều thành phần (MCC_TRANS)
Hình J.3 minh họa việc xử lý tham gia vào một giai đoạn duy nhất của hướng ngược nhiều thành phần biến đổi. Trong một giai đoạn nhất định, một tập hợp của một hoặc nhiều CC_TRANS hoạt động được thực hiện. Thứ tự mà trong đó các hoạt động này được thực hiện là không quan trọng; Các quy tắc cú pháp của MCC phân đoạn nhãn đảm bảo rằng các hoạt động CC_TRANS trong một giai đoạn có thể được thực hiện song song.
Các thiết lập của đầu vào thành phần có sẵn cho giai đoạn Biến đổi kth, trong đó k [0, 1,…, Nmco-1], là tập hợp thành phần trung gian Ik. Tập hợp các thành phần đầu ra từ giai đoạn Biến đổi kth là tập trung cấp thành phần Ik + 1. Tập đầu tiên của thành phần trung gian, I0, được định nghĩa là tập hợp các thành phần dựng lại trong không gian được tạo ra bởi biến đổi hai chiều sóng con hướng ngược. Trung cấp thành phần bộ lũ chứa các thành phần Csiz, trong đó Csiz được chỉ định trong phân khúc đánh dấu kích. Nếu S(n) là thứ n thành phần dựng lại trong không gian, sau đó I0(n) = S(n), n = 0, 1,…, Csiz-1. Tương tự, tập hợp các thành phần dựng lại ảnh được định nghĩa là tập trung cấp thành phần, cuối cùng. Trung cấp thành phần bộ INmco chứa các thành phần Ncbd, trong đó Ncbd được chỉ định trong phân khúc đánh dấu CBD. Nếu R(n) là xây dựng lại các thứ n thành phần ảnh, sau đó R(n) = INmco(n), n = 0, 1,…, Ncbd-1. Số lượng các thành phần trung gian, Nlk, trong thành phần trung gian thiết lập, Ik, 0 □ k < Nmco, được cho bởi:
NIk = 1 + [Cmccij (k)] (J-1)
Trong công thức này, Cmccij(k) được lấy từ các phân đoạn nhãn MCC tương ứng với giai đoạn Biến đổi kth. Các chức năng tối đa chỉ đơn giản là tìm thấy giá trị Cmccij lớn nhất từ giai đoạn Biến đổi kth trên tất cả thành phần tập hợp trong giai đoạn đó. Nl0 biến = Csiz và NlNmco = Ncbd. Tất cả thông tin liên quan đến hoạt động CC_TRANS được chuyển tải trong phân khúc đánh dấu MCC. Chỉ số của MCC có liên quan điểm phân đoạn nhãn cho giai đoạn kth hướng ngược nhiều thành phần Biến đổi thu được từ trường lmcok đoạn MCO đánh dấu. Một sơ đồ dòng chảy mà kết quả trong giải mã chính xác của dòng mã được đưa ra trong hình J.4. (Sơ đồ dòng chảy này áp dụng các hoạt động CC_TRANS theo thứ tự mà các tập hợp xuất hiện bên trong điểm đánh dấu đoạn hoạt động của MCC.)
Hình J.3 – Giai đoạn Biến đổi tập hợp nhiều thành phần đơn (MCC_TRANS)
Hình J.4 – Thủ tục MCC_TRANS
J.2.3 Tập hợp thành phần biến đổi (CC_TRANS)
Dòng xử lý để biến đổi một tập hợp thành phần nhất định được minh chúng a trong hình J.5. Các Hình cho thấy vị trí của MCC có liên quan điểm phân đoạn nhãn trường cho tập hợp thành phần thứ i trong phân đoạn nhãn đó. Mỗi tập hợp thành phần trong một giai đoạn Biến đổi thực hiện một trong một số xử lý khác nhau bước được xác định trong các điều khoản tiếp theo của phụ lục này. Các tập hợp thành phần thứ i hoạt động trên một tập hợp con,
, của đầu vào thành phần trung gian ở giai đoạn Biến đổi hiện thời, k, và nó tạo ra một số tập hợp con, , Các thành phần trung gian đầu ra từ giai đoạn Biến đổi hiện tại. trong Hình , Cmcci = {Cmccij}, j [0, 1, … , Nmcci – 1], và Wmcci = {Wmccij}, j [0, 1, … , Mmcci – 1]. Đối với mỗi của các tập hợp thành phần trong các phân đoạn nhãn MCC có liên quan, khoản mục s sau, theo thứ tự, mô tả việc xử lý xảy ra. (Khoản mục s song song với các khối chức năng trong chuyển J.6.)
Tất cả các phương pháp Biến đổi quy định tại phụ lục này làm cho việc sử dụng các tập hợp thành phần. Một tập hợp thành phần bao gồm một danh sách các đầu vào thành phần chỉ số cùng với một danh sách các đầu ra thành phần chỉ số. Các tập hợp thành phần được định nghĩa trong MCC phân đoạn nhãn (xem A.3.8). Danh sách đầu vào thành phần của một tập hợp xác định thứ tự trong đó thành phần trung gian đầu vào đến giai đoạn được truy cập bởi biến đổi. Đặc biệt, cho tập hợp thành phần thứ i trong giai đoạn Biến đổi kth, đầu vào Biến đổi thành phần thứ the jth, , được cho bởi Ik{Cmccij), ở đó 0 ≤ j < Nmcci. Tương Tự như vậy, danh sách thành phần đầu ra của một tập hợp chỉ định mà thành phần trung gian đầu ra bởi giai đoạn được lấp đầy bởi một biến đổi liên kết. Đầu ra thành phần (ở đó 0 ≤ j < Mmcci) từ Biến đổi được gán cho thành phần trung gian Ik + 1(Wmccij).
Các chỉ số Cmccij VÀ Wmccij, và những số của các thành phần đầu vào và đầu ra, Nmcci và Mmcci, tất cả xuất hiện trong một phân khúc đánh dấu MCC. Cơ chế tập hợp thành phần cho phép các hoán vị của các thành phần ở cả hai đầu vào và đầu ra của sự Biến đổi liên kết.
Số lượng các thành phần đầu ra có thể lớn hơn, ít hơn hoặc bằng số lượng đầu vào thành phần. Một số hạn chế được đặt trên mối quan hệ giữa số lượng đầu vào và đầu ra các thành phần tùy thuộc vào loại Biến đổi kết hợp với một bộ sưu tập, như được miêu tả sau này. Ngoài ra, tất cả các thành phần xuất hiện trong danh sách đầu vào của một tập hợp phải có cùng một kích thước mẫu, như được đưa ra Khuyến nghị T.800 của ITU| tiêu chuẩn ISO/IEC 15444-1 phụ lục B, phương trình B-13. Điều này đảm bảo rằng một mẫu từ mỗi thành phần trong tập hợp sẽ có sẵn tại các địa điểm phổ biến trên mạng lưới tài liệu tham khảo bởi thực thi một đăng ký của các thành phần đầu vào trong bộ sưu tập.
Biến đổi hoạt động trên tập hợp thứ ith được định nghĩa trong trường Tmcci của hoạt động đánh dấu phân đoạn phân đoạn nhãn phân đoạn nhãn phân đoạn MCC. Thêm vào đó, trường Tmcci có thể tham chiếu các ma trận của các hệ số Biến đổi mà được xác định trong động phân đoạn nhãn (Xem A.3.7) hoặc có thể xác định cụ thể hạt nhân sóng con để sử dụng (xem A.3.5). Trường Omcci cũng có thể được sử dụng để cung cấp cho một đối tượng dời hình theo hướng về thành phần cho một biến đổi sóng con. Trong chuyển J.6 và sau đó khoản mục s của phụ lục này, Ti sẽ dùng để Biến đổi ma trận hoặc thông tin biến đổi sóng con tương ứng với tập hợp thành phần thứ i trong giai đoạn Biến đổi hiện nay.
Sự Biến đổi hoạt động trên tập hợp ith được xác định trong trường Tmcci đánh dấu đoạn hoạt động của MCC. Ngoài ra, trường Tmcci có thể tham khảo các ma trận của các hệ số Biến đổi được chỉ định trong MCT phân đoạn nhãn (xem A.3.7) hoặc có thể xác định cụ thể sóng con hạt nhân để sử dụng (xem A.3.5). Trường Omcci cũng có thể được sử dụng để cung cấp cho một đối tượng dời hình theo hướng về thành phần cho một biến đổi chiều sóng con. Trong chuyển J.6 và sau đó khoản mục s của phụ lục này, Ti sẽ dùng để Biến đổi ma trận hoặc thông tin biến đổi sóng con tương ứng với tập hợp thành phần thứ i trong giai đoạn Biến đổi hiện nay.
Hình J.5 – Giai đoạn Biến đổi tập hợp nhiều thành phần đơn (CC_TRANS)
Hình J.6 – Thủ tục CC_TRANS
J.2.3.1 Xác định đầu vào tập hợp thành phần (DEF_INPUT_CC)
Đối với tập hợp, i, thì tập Ci của đầu vào thành phần đối với biến đổi được hình thành bằng cách lựa chọn một tập con của các thành phần trung gian biến đổi, Ik. Tập này chứa Nmcci thành phần. Thành phần thứ j, , trong tập đầu vào được đưa ra bởi thành phần trung gian lk(Cmccij), khi 0 ≤ j < Nmcci và Cmccij ϵ[0, 1,…, Nlk – 1]. Chỉ số k là số giai đoạn biến đổi, giá trị của Nmcci và Cmccij được định nghĩa trong tập hợp thứ I của phân đoạn nhãn MCC tương ứng đối với giai đoạn chuyển đổi k. phân đoạn nhãn MCC này có cùng giá trị chỉ số, Imcc, như vậy đối với giai đoạn biến đổi thứ k, Imcok, trong phân đoạn nhãn MCO. Yêu cầu rằng tập hợp các thành phần chứa giai đoạn biến đổi “chạm” tất cả các biến đầu vào thành phần trung gian (tức là tập hợp các thành phần trung gian từ giai đoạn biến đổi trước). Điều này có nghĩa là mọi chỉ số thành phần trung gian từ 0 đến Nlk – 1 phải xuất hiện trong danh sách đầu vào của tối thiểu một tập hợp thành phần. Nếu đầu vào thành phần trung gian không được sử dụng trong bất cứ quá trình biến đổi nào trong giai đoạn biến đổi hiện tại, thì nó phải xuất hiện trong biến đổi null (xem J.3). Như nêu ở trên, Không có yêu cầu chung rằng số lượng của các thành phần đầu ra từ quá trình biến đổi bằng số lượng đầu vào của các thành phần. Vì vậy có thể các thành phần thêm được chèn vào (hoặc tạo ra) trong quá trình biến đổi nhiều thành phần. Bước quá trình này không cần thiết chắc chắn xảy ra trong quá trình biến đổi. Nó có thể xảy ra chắc chắn thông qua sử dụng các thành phần chung gian null.
Một thành phần null là một đầu ra của nó không được xác định bởi giai đoạn chuyển đổi trước đó (ví dụ, giai đoạn thứ (k-1)) trong sự hình thành của các thành phần trung gian, lk. Điều này có thể xảy ra khi các liên kết của tất cả đầu ra thành phần liệt kê từ giai đoạn chuyển đổi trước đó không bao gồm mọi thành phần số giữa 0 và số lượng đầu vào thành phần lớn nhất, Nlk-1, của giai đoạn chuyển đổi hiện tại. Nói cách khác, có thể có những khoảng trống trong tập số lượng thành phần đầu ra trung gian từ giai đoạn biến đổi trước. Khi một thành phần null truy cập vào một tập hợp thành phần trung gian nhất định, nó được xử lý bởi quá trình biến đổi như là một thành phần với giá trị giống zero. (Ví dụ thông tin trong O.3 minh họa tiềm năng sử dụng của các thành phần null.).
Khi tạo thành một loạt các giai đoạn biến đổi làm việc cùng nhau, phải quan tâm trong phát ra danh sách các đầu ra và đầu vào thành phần giữa giai đoạn biến đổi kế tiếp. Nó không được phép đối với một số thành phần đầu ra trong giai đoạn k-1 vượt quá giá trị Nlk-1 đối với giai đoạn biến đổi hiện tại k
J.2.3.2 Áp dụng biến đổi (APPLY_TRANS)
Cho các thành phần đầu vào thiết lập Ci, chứa thành phần Nmcci, hướng ngược lựa chọn nhiều thành phần Biến đổi được áp dụng. Trường Xmcci đánh dấu đoạn hoạt động của MCC chỉ ra loại Biến đổi được sử dụng để biến đổi tập hợp thành phần thứ i. Các biến đổi được cho phép và ứng dụng của họ được thảo luận trong J.3. Trường Tmcci đánh dấu đoạn hoạt động của MCC cung cấp thông tin bổ sung là cần thiết cho việc Biến đổi cụ thể, chẳng hạn như liên kết đến Biến đổi ma trận hệ số chứa trong một điểm đánh dấu MCT phân đoạn (xem A.3.7), hạt nhân biến đổi sóng con chứa trong một điểm đánh dấu ATK phân đoạn (xem A.3.5), số lượng sóng con biến đổi mức độ, và các chỉ số của reversibility của biến đổi. Trong trường hợp của biến đổi sóng con, trường Omcci cũng cung cấp tương đương với một đối tượng dời hình gạch để biến đổi chiều sóng con. Các ứng dụng của sự Biến đổi kết quả trong một tập hợp các thành phần đầu ra, Wi, chứa các thành phần Mmcci.
J.2.3.3 Ấn định các thành phần đầu ra (MAP_OUTPUT_CC)
Biến đổi đối với tập hợp thành phần thứ ith sản sinh tập đầu ra các thành phần Mmcci, Wi. Wi sau đó được gán cho một tập hợp con của các thành phần trung gian của đầu ra từ giai đoạn, lk+1. Cụ thể, các thành phần đầu ra (ở đó 0 ≤ j < Mmcci) từ sự Biến đổi được gán cho thành phần trung gian Ik+1(Wmccij). Này tập hợp con của các thành phần trung gian đầu ra cũng được gọi là . Các giá trị Mmcci và Wmccij được tìm thấy trong tập hợp thành phần thứ i của đánh dấu đoạn hoạt động của MCC cho giai đoạn Biến đổi kth..
Cần thiết rằng không có đầu ra thành phần trung gian xuất hiện nhiều hơn một lần trong một liên minh của tất cả sản lượng thành phần tập hợp danh sách trong vòng một MCC đặc biệt phân đoạn nhãn (tức là Wmcci Ç Wmccj = Ø, “ I ¹ j). Quy tắc này ngụ ý rằng tất cả thành phần tập hợp có thể được chuyển song song mà không có nguy cơ ghi đè lên kết quả tính toán trước đây. Như đã nói ở trên, danh sách thành phần đầu ra có thể không đầy đủ, do đó cho phép giai đoạn Biến đổi để tạo thành phần bằng không. Sản lượng tối nhiểu thành phần số có thể không vượt quá Nlk + 1-1, số tối nhiểu thành phần đầu vào giai đoạn Biến đổi thành công. Có là không có yêu cầu sản lượng thành phần tập hợp danh được hoàn thành cho giai đoạn cuối cùng biến đổi. Tuy nhiên, các tiện ích của các thành phần không hình ảnh như vậy là đáng ngờ và sử dụng của họ không được khuyến khích.
J.3 Biến đổi
Khoản mục này chi tiết toán học tham gia vào việc áp dụng một hướng ngược nhiều thành phần biến đổi. Nó cũng mô tả vị trí và giải thích của các trường còn lại trong tập hợp thành phần thứ i của đánh dấu đoạn hoạt động của MCC được yêu cầu cho các ứng dụng của sự Biến đổi cụ thể.
Đối với mỗi của các biến đổi thảo luận tại khoản mục này, nó giả định rằng tập hợp đầu vào thành phần của sự biến đổi, C = Ci, đã được thành lập. Mỗi thành phần trong bộ được ký hiệu là Cj, ở đó j = [0, 1,…, N-1], và N = Nmcci. Tất cả các biến đổi mô tả được giả định để sản xuất một bộ Biến đổi thành phần, W = Wi, với các thành viên được biểu thị bằng Wj, ở đó j = [0, 1,…, M – 1], VÀ M = Mmcci.
Này tập hợp các chuyển thành phần này bao gồm các tập hợp thành phần đầu ra. Hai bộ của các thành phần sẽ được gọi chung là đầu vào và đầu ra các thành phần của biến đổi. Phương trình trình bày trong này khoản mục được chính tắc chỉ trong ý nghĩa rằng họ mô tả một kết quả mà các bộ giải mã phải đạt được; việc triển khai khác nhau của các phương trình có thể tồn tại cho bộ giải mã hoàn toàn phù hợp.
J.3.1 Biến đổi dựa trên ma trận
Biến đổi dựa trên ma trận có thể được mô tả bởi tập hợp các phương trình tuyến tính trong các thành phần đầu vào. Hệ số Biến đổi áp dụng cho các thành phần trong sau đây quations, cũng như các thành phần phụ gia độ lệch s, được gọi là ma trận. Các ma trận được lưu trữ trong mã dòng MCT phân đoạn nhãn (xem A.3.7). Với biến đổi dựa trên ma trận, trường Tmcci tập hợp thành phần thứ i trong điểm đánh dấu đoạn hoạt động của MCC chứa chỉ số của một ma trận Biến đổi và chỉ số của một ma trận độ lệch. Trường Xmcci cho tập hợp thành phần thứ i trong điểm đánh dấu đoạn hoạt động của MCC xác định kiểu ma trận dựa trên Biến đổi được áp dụng (dec Hoặc relation hoặc phụ thuộc, đảo ngược hoặc không thể đảo ngược) vào tập hợp thành phần.
Nếu chỉ số ma trận Tmcci là không, các chỉ số, cùng với kiến thức về loại Biến đổi dựa trên ma trận đang được áp dụng, được sử dụng để chọn các điểm phân đoạn nhãn MCT thích hợp, mà từ đó các hệ số được chiết xuất. Đối với ma trận biến đổi, đoạn đánh dấu thích hợp MCT được tìm thấy bằng cách kết hợp các chỉ số phân đoạn MCT đánh dấu tìm thấy trong tham số Imct chống lại chỉ số ma trận Biến đổi Tmcci, và sau đó kết hợp các loại Biến đổi Xmcci chống lại các loại ma trận tìm thấy trong các tham số Imct. Cho các ma trận độ lệch, đoạn đánh dấu thích hợp MCT được tìm thấy bằng cách kết hợp các chỉ số phân đoạn MCT đánh dấu tìm thấy trong tham số Imct chống lại chỉ số ma trận độ lệch Tmcci, và sau đó kiểm tra kiểu ma trận tìm thấy trong tham số Imct chỉ ra các ma trận là một ma trận độ lệch.
Một chỉ số của số không trong một trường Tmcci chỉ ra một không Biến đổi hoặc bù đắp ma trận, do đó Biến đổi cụ thể bước có thể được bỏ qua. Đối với mỗi của các biến đổi dựa trên ma trận thảo luận trong này khoản mục, thứ tự số và lưu trữ của hệ số trong đoạn MCT đánh dấu được xác định
J.3.1.1 Biến đổi không tương quan
Loại Biến đổi không tương quan cung cấp cho một tổ hợp tuyến tính không bị giới hạn của thành phần đầu vào với phụ gia độ lệch s cho mỗi kết quả. Cấu trúc biến đổi này cho phép đầy đủ ma trận biến đổi như KLT.
J.3.1.1.1 Biến đổi không tương quan không thuận nghịch
Việc biến đổi không tương quan không đảo ngược gồm một phép nhân ma trận của các thành phần nhập theo sau là ứng dụng của một phần bù phụ thêm. Sự biến đổi được áp dụng bằng cách sử dụng phương trình J-2.
Nếu chỉ số ma trận biến đổi không đối xứng cung cấp bởi các trường Tmcci đối với các tổ hợp thành phần là không (zero), thì hệ số tij được đưa ra bởi tij = 1 đối với i ¹ j và tij = 0 với i ¹ j. Nếu chỉ số ma trận biến đổi không tương quan không phải là không (zero), thì phân đoạn nhãn tham chiếu MCT chưa M x N phần tử. Hệ số tij được lưu trữ trong phân đoạn nhãn theo trật tự sau đây: t00, t01,…, t0(N – 1), t10, t11,…, t1(N – 1),… t(M – 1)(N – 1).
Nếu chỉ số ma trận độ lệch cung cấp bởi trường Tmcci đối với tập hợp các thành phần là không (zero), thì hệ số oi được đưa ra bởi oi = 0. Nếu chỉ số ma trận độ lệch không phải là không zero, thì phân đoạn nhãn tham chiếu MCT chứa M phần tử. Hệ số oi được lưu trong phân đoạn nhãn theo trật tự o0, o1,…, oM – 1.
Đối với biến đổi không tương quan không đảo nghịch, Số lượng các thành phần đầu vào, N, không yêu cầu bằng số lượng các thành phần đầu ra, M.
J.3.1.1.2 Biến đổi không tương quan không thuận nghịch hướng thuận (thông tin)
Tại một vị trí không gian cụ thể, (x, y), Thành phần ảnh M được biến đổi được thể hiện bởi W0, W1, … , WM – 1. Các thành phần dc lệch được đưa ra bởi o0, o1, … , oM – 1, và thành phần N là kết quả của sự biến đổi được biểu hiện bằng C0, C1,…, CN – 1. Biến đổi không tương quan không hướng ngược chuyển tiếp được áp dụng bằng cách sử dụng phương trình J-3.
Độ lệch o0, o1, … , oM – 1 được bao hàm trong phân đoạn nhãn trong MCT. Chỉ số ma trận độ lệch cung cấp bởi trường Tmcci đối tập hợp các thành phần phải giống chỉ số ma trận MCT. Nếu tất cả các độ lệch với nhau bằng không, thì trường Tmcci đối với tập hợp các thành phần này có thể đặt bằng không và độ lệch không cần thiết phải bao hàm trong phân đoạn nhãn MCT.
Hệ số tij đối với biến đổi không hướng ngược được bao hàm trong phân đoạn nhãn MCT thông thường không giống nhau như xuất hiện trong phương trình biến đổi chuyển tiếp. Ví dụ, Nếu biến đổi đối với tổ hợp thành phần là đơn nhất, thì hệ số biến đổi hướng ngược là ma trận matrix biến đổi của hệ số biến đổi chuyển tiếp, trách nhiệm của các bộ mã hóa để tạo thành một cách chính xác thông tin biến đổi hướng ngược theo yêu cầu của các bộ giải mã.
J.3.1.1.3 Biến đổi không tương quan thuận nghịch
Sự biến đổi không tương quan chiều nghịch bao gồm một tập hợp các yếu tố duy nhất biến đổi tuyến tính theo sau là ứng dụng của một độ lệch thêm. Đối với biến đổi không tương quan chiều nghịch, số lượng đầu vào thành phần N, cần thiết phải bằng số lượng các thành phần đầu ra, M. Điều này đúng ngay cả khi số lượng biến đổi tuyến tính đơn áp dụng trong việc xử lý là N + 1. Sự biến đổi được áp dụng bởi các bộ phương trình sau đây:
Hãy để biến tạm thời P được định nghĩa là:
P0 = C0
P1 = C1
P2 = C2
P3 = C3
sau đó hình thành theo trình tự của phép biến đổi tuyến tính phần tử duy nhất bằng cách sử dụng phương trình J-4 và các quy tắc làm tròn xác định.
tính toán tiếp theo biến đổi phần tử đơn cùng bằng cách sử dụng phương trình J-5 và áp dụng độ lệch thêm trong phương trình J-6 để tạo thành các thành phần trung gian đầu ra. Đối với biến đổi chiều nghịch không tương quan, các tổng SI, I = [0, 1, … , N], phải được tạo ra trong trật tự và thuật ngữ duy nhất đầu ra tương ứng với tổng đó, PN – 1 – I, phải được điều chỉnh trước khi tổng tiếp theo được tính.
Hình minh họa J.7 tính toán được mô tả trong phương trình J-4 đến J-6. Mỗi giai đoạn của biến đổi điều chỉnh chính xác một thành phần đầu ra. Một tổ hợp tuyến tính của các thành phần sinh ở từng giai đoạn đầu tiên được thành lập. Một phần tổng này được làm tròn bởi một quy tắc làm tròn chiều nghịch. Kết quả số nguyên sẽ được thêm vào các thành phần được điều chỉnh ở giai đoạn đó (và kết quả có thể âm ở giai đoạn cuối). Các hoạt động này dẫn đến giá trị số nguyên tất cả thành phần ở từng giai đoạn.
Hơn nữa, kể từ khi một giá trị thành phần duy nhất thay đổi bằng cách thêm một số nguyên ở từng giai đoạn, biến đổi này có thể đảo ngược chỉ đơn giản bằng cách đảo ngược thứ tự của các phần tử bước biến đổi duy nhất. Cũng hiển thị trong hình là hai hoán vị ma trận PRJ và PL được đưa vào cấu trúc của biến đổi đảo ngược không tương quan. Ở đây chúng rõ ràng chỉ ra rằng thừa số SERM có thể không sản sinh các thành phần biến đổi đầu ra theo thứ tự như là ma trận không tương quan, nó là phép tương đối (gần đúng), Cho rằng thừa số Cho rằng SERM có thể không tạo ra các thành phần chuyển theo thứ tự như biến đổi đơn nhất xấp xỉ, một bộ mã hóa có thể chọn để khắc phục tình trạng này thông qua việc sử dụng của danh sách chỉ mục tập hợp các thành phần trung gian.
Hình J.7- Thực hiện SERM đối với biến đổi đảo ngược không tương quan
CHÚ THÍCH – (thông tin): cấu trúc biến đổi đảo ngược không tương quan này chứa một thừa số thuận nghịch của một ma trận biến đổi đơn nhất N x N mà xấp xỉ thuộc tính không tương quan của nó. Một thừa số kỹ thuật như vậy, được gọi là thừa số ma trận (SERM) hàng đơn đảo ngược được mô tả trong [14]. Biến đổi đơn nhất bao gồm một lớp lớn nhiều biến đổi thành phần (ví dụ bao gồm KLT). Một ví dụ thông tin được đưa ra trong O.3 dựa trên các kỹ thuật trình bày trong [14].
Nếu chỉ số ma trận biến đổi không tương quan cung cấp bởi trường Tmcci đối với tập hợp thành phần là không (zero), thì hệ số tij được đưa ra bởi tN(N – 1) = 1, ti(N – 1 – i) = 1 đối với i[0, … , N – 1], và tij = 0 đối với toàn bộ i, j khác. Nếu chỉ số ma trận biến đổi không tương quan khác không, thì phân đoạn nhãn tham chiếu MCT chứa (N + 1) x N phần tử. Hệ số tij được lưu trong phân đoạn nhãn theo các trật tự sau: t00, t01, … , t0(N – 1), t10, t11, … , t1(N – 1), … tN(N – 1). Các hệ số bị hạn chế bởi số nguyên đối với biến đổi không tương quan hướng ngược. Mặt khác, hệ số tN(N – 1) VÀ ti(N – 1 – i) đối với [0, … , N – 1] bị hạn chế đề trích xuất số nguyên dương bậc cơ số 2, khi đó tN(N – 1) bị hạn chế để nhận giá trị tuyệt đối bằng đúng giá nguyên dương lũy thừa cơ số 2.
Tập hợp con này của các hệ số được coi như là một tập hợp mở rộng các yếu tố cho mỗi một phần tổng được hình thành. Điều này cho phép hệ số giá trị thực thể xấp xỉ các gần nhất bit phân đoạn. Các hạn chế về các giá trị hệ số đảm bảo các tổng có thể được thực hiện, nếu mong muốn, với tất cả các phép tính số nguyên.
Nếu chỉ số ma trận độ lệch cung cấp bởi trường Tmcci đối với tập hợp thành phần là không, thì hệ số oi được đưa ra bởi oi = 0. Nếu chỉ số ma trân độ lệch không bằng không, thì phân đoạn nhãn tham chiếu chứa M phần tử. Hệ số oi được lưu vào trong phân đoạn nhãn theo một trật tự sau o0, o1, … , oM □ 1. Đối với biến đổi nghịch không tương quan, Yêu cầu oi phải là số nguyên.
J.3.1.1.4 Biến đổi phụ thuộc thuận nghịch hướng thuận (thông tin)
Tại một vị trí không gian cụ thể, (x, y) thành phần ảnh N được biến đổi được thể hiện bởi W0, W1,… , WN – 1. Độ lệch DC thành phần được đưa ra bởi o0, o1, … , oN – 1, và các thành phần mà kết quả từ biến đổi được thể hiện C0, C1, … , XN – 1. Biến đổi chiều thuận không tương quan không hướng ngược được áp dụng bằng cách sử dụng phương trình J-7 đến J10. SERM thực hiện một biến đổi không tương quan đảo ngược được thể hiện trong hình J.8.
Các giá trị thành phần đầu vào đầu tiên được dịch bởi một độ lệch dc. Các kết quả được chỉ định biến tạm thời Pi. Các thành phần đầu vào N sau đó được biến đổi trong một loạt các bước N + 1. Tại mỗi bước, chính xác là một trong các giá trị đầu vào được thay đổi. Các bước biến đổi phải được thực hiện tuần tự, và các giá trị tạm thời, Pi, phải được cập nhật trong mỗi bước và được sử dụng trong bước tiếp theo. Trong bước đầu tiên, được đưa ra trong phương trình J-8, giá trị tạm thời cuối thay đổi. Phương trình J–9 là sau đó áp dụng N lần, với giá trị của l chạy từ 1 đến N. Ở lth các bước sau, giá trị tạm thời Pl thay đổi. Tập cuối cùng của giá trị tạm thời sẽ trở thành đầu ra của sự biến đổi.
Hình J.8 – Thực hiện SERM của biến đổi không tương quan hướng ngược
Các độ lệch o0, o1, …, oM – 1 phải là giá trị số nguyên c và được bao gồm trong một phân đoạn nhãn MCT. Chỉ số ma trân độ lệch được cung cấp bởi trường Tmcci cho tập hợp thành phần này phải phù hợp với chỉ số ma trận MCT. Nếu các độ lệch tất cả đều bằng không, thì trường Tmcci đối với tập hợp thành phần này có thể được đặt bằng không và các độ lệch không cần thiết phải được bao gồm trong một phân đoạn nhãn MCT.
Hệ số tli đối với biến đổi hướng ngược được bao gồm trong các phân đoạn nhãn MCT nói chung không như những xuất hiện trong phương trình biến đổi hướng thuận. Nói chung là đúng rằng tij trong phương trình J-4 và J-5 sẽ được ngang bằng với t(N – i)j trong phương trình J-8 và J-9. Có một số khó khăn bổ sung về các giá trị hệ số đối với biến đổi không tương quan hướng thuận đảo ngược. Tất cả tij phải là số nguyên có giá trị, t0(N- 1)) phải có một giá trị tuyệt đối mà là một số mũ cơ số 2, và ti(i – 1) đối với i = 1, 2,…, N phải là số mũ cơ số 2. Các hệ số là số mũ cơ số 2 có thể được giải thích trong các phương trình như yếu tố độ lớn cho từng bước trong sự biến đổi. Mục con O.3 cung cấp ví dụ minh họa thông tin biến đổi không tương quan, thừa số SERM, và liên quan đến việc thực hiện đảo ngược.
J.3.1.2 Biến đổi phụ thuộc
Loại biến đổi phụ thuộc cho phép đối với biến đổi tiên đoán, vốn có trong sự biến đổi phụ thuộc là khái niệm mà các đầu ra thành phần thứ (j + 1) có thể được tính toán chỉ sau khi các thành phần đầu ra thứ j được giải mã. Cấu trúc biến đổi phụ thuộc cho phép sử dụng dự đoán giống như biến đổi dựa trên DPCM. Một ví dụ về loại biến đổi này được đưa ra trong O.3.
J.3.1.2.1 Biến đổi phụ thuộc không thuận nghịch
Việc biến đổi không thể đảo ngược phụ thuộc độ lệch cộng thêm theo sau là một tổ hợp tuyến tính hạn chế của các thành phần. Biến đổi phụ thuộc được xác định bởi các thiết lập sau đây của phương trình:
Phương trình J-12 ngụ ý một cấu trúc cụ thể trong ma trận biến đổi phụ thuộc không đảo ngược. Cụ thể, các ma trận biến đổi phụ thuộc không đảo ngược phải thấp hơn bên trái hình tam giác với giá trị không (Zero) trên và phía trên đường chéo chính. Cấu trúc đặc biệt này đảm bảo rằng các ma trận có thể được xử lý từ trên xuống dưới và quan hệ nhân quả sẽ được bảo tồn. Điều này đặt trách nhiệm đối với các bộ mã hóa để tạo thành một cách chính xác ma trận biến đổi phụ thuộc không đảo ngược kết hợp với các đầu vào và đầu ra danh sách chỉ mục tập hợp thành phần trung gian. Hình J.9 minh họa các bước xử lý trong biến đổi phụ thuộc không đảo ngược. Hộp nhãn, P (W0, W1,…, Wj-1), trong biểu đồ là nơi dự báo cho các thành phần hiện tại đang được giải mã được hình thành từ các thành phần giải mã trước đó.
Hình J.9- Biến đổi phụ thuộc không thể đảo ngược
Nếu chỉ số ma trận biến đổi phụ thuộc cung cấp bởi trường Tmcci đối với tập hợp thành phần thứ I là không, thì hệ thống tij được đưa ra bởi tij = 0 đối với i, j. Nếu chỉ số ma trận biến đổi phụ thuộc không phải là không (zero), phân đoạn nhãn tham chiếu MCT chứa M x (M – 1)/2 phần tử. Hệ số tij được lưu trong phân đoạn nhãn theo trật tự sau: t10, t20, t21, t30, t31, t32, …, t(M – 1)0,…, t(M – 1)(M – 2).
Nếu chỉ số ma trận độ lệch cung cấp bởi trường Tmcci đối với tập hợp thành phần thứ i là zero, thì hệ số oi được đưa ra bởi oi = 1. Nếu chỉ số bù đắp ma trận không phải là zero, thì các phân đoạn nhãn MCT tham có chứa M phần tử. hệ số oi được lưu trữ trong các phân đoạn nhãn theo trật tự sau: o0, o1,…, oM-1. Đối với một biến đổi phụ thuộc, số đầu vào thành phần, N, là phải bằng số lượng các thành phần đầu ra, M.
J.3.1.2.2 Biến đổi phụ thuộc không thuận nghịch hướng thuận (thông tin)
Sự biến đổi phụ thuộc không đảo ngược chiều thuận bao gồm một tổ hợp tuyến tính hạn chế của các thành phần và một đối tượng bù thêm. Tại một vị trí không gian cụ thể, (x, y), các thành phần ảnh N được biến đổi được biểu hiện bằng W0, W1,…, WN-1. Các thành phần độ lệch được đưa ra bởi o0, o1, … , oN – 1, và các thành phần mà kết quả của sự biến đổi được biểu hiện bằng C0, C1,…, CN-1. Biến đổi phụ thuộc chiều thuận được xác định bởi các thiết lập sau đây của phương trình và minh họa trong hình J.10:
Hình J.10 – Biến đổi không phụ thuộc chiều thuận không hướng ngược
Độ lệch o0, 01, … , oM – 1 được bao hàn trong phân đoạn nhãn MCT. Chỉ số ma trận độ lệch chung cấp bởi trường Tmcci đối với tổ hợp thành phần này phải giống như chỉ số ma trận MCT. Nếu tất cả độ lệch bằng không, thì trường Tmcci đối với tổ hợp thành phần có thể đặt bằng không và độ lệch không cần thiết phải bao hàm trong phân đoạn nhãn MCT.
Hệ số tij đối với biến đổi hướng ngược được bao gồm trong các phân đoạn nhãn MCT nói chung là giống như những đã xuất hiện trong phương trình biến đổi chiều thuận. Trong phương trình J-12, tất cả phép tính là phép cộng, trong khi biến đổi chiều thuận, tất cả phép tính là phép trừ.
J.3.1.2.3 Biến đổi phụ thuộc thuận nghịch
Sự biến đổi phụ thuộc chiều nghịch bao gồm một độ lệch thêm bởi một tổ hợp tuyến tính hạn chế của các thành phần. Sự biến đổi phụ thuộc chiều nghịch được xác định bởi các thiết lập sau đây của phương trình:
Phương trình J-15 ngụ ý một cấu trúc cụ thể trong ma trận biến đổi phụ thuộc chiều nghịch. Cụ thể, các ma trận biến đổi phụ thuộc đảo ngược phải thấp hơn bên trái hình tam giác bằng số không ở trên đường chéo chính. Hệ số trên đường chéo chính của ma trận (ngoại trừ t00) yếu tố mở rộng có thể được sử dụng để chia tỷ lệ giá trị thực ma trận biến đổi phụ thuộc và đại diện với một số phân đoạn bit mong muốn. Cấu trúc đặc biệt này đảm bảo rằng các ma trận có thể được xử lý từ trên xuống dưới và quan hệ nhân quả sẽ được bảo tồn. Điều này đặt một trách nhiệm khi các bộ mã hóa đúng cách tạo thành ma trận biến đổi phụ thuộc đảo nghịch kết hợp với các đầu vào và đầu ra danh sách chỉ mục tập hợp các thành phần trung gian. Hình J.11 minh họa việc xử lý biến đổi phụ thuộc đảo nghịch. Hộp nhãn “R” đại diện cho một quy tắc làm tròn, mà đã được định nghĩa là các hàm trần trong tiêu chuẩn này.
Hình J.11 – Biến đổi không phụ thuộc hướng ngược
Nếu chỉ số ma trận biến đổi phụ thuộc cung cấp bởi trường Tmcci đối với tập hợp thành phần là không, thì hệ số tij được đưa ra bởi tij = 0 đối với tất cả I i ¹ j, và tij = 1 đối với i = j. Nếu chỉ số ma trận biến đổi phụ thuộc không phải là không thì phân đoạn đánh dấu tham chiếu MCT chứa phần tử. Hệ số tij được lưu trong phân đoạn đánh dấu theo trật tự sau: t10, t11, t20, t21, t22, t30, t31, t32, t33, … , t(M – 1)0, … , t(M – 1)(M – 1). Đối với i ¹ j, Hệ số tij có cùng một giả thích như trong biến đổi phụ thuộc không đảo ngược. Ngoài ra, hệ số M – 1, tij trong đó i = j i > 0, được giải thích như là hệ số mở rộng đối với một phần tổng SI. Hệ số tij giới hạn phải là số nguyên trong biến đổi phụ thuộc hướng ngược. Hơn thế nữa, Hệ số tij đối với i = j và i > 0 bị giới hạn đúng là số nguyên mũ cơ số 2. Hạn chế này cho phép một phần tổng có thể được tạo ra, Nếu mong muốn, với toàn bộ các phép tính toán số nguyên.
Nếu chỉ số ma trận độ lệch cung cấp bởi trường Tmcci cho tập hợp các thành phần này là 0, thì hệ số oi hệ số oi được đưa ra bởi oi = 0. Nếu chỉ số bù đắp ma trận không phải là không, thì các phân đoạn nhãn MCT tham chiếu có chứa M phần tử. hệ số oi được lưu trữ trong các phân đoạn nhãn theo thứ tự sau: o0, o1,…, oM-1. Các hệ số bị hạn chế để là số nguyên đối với biến đổi phụ thuộc đảo ngược. Đối với một biến đổi phụ thuộc đảo ngược, số lượng đầu vào thành phần, N, cần thiết phải bằng số lượng các thành phần đầu ra, M.
J.3.1.2.4 Biến đổi phụ thuộc thuận nghịch hướng thuận (thông tin)
Biến đổi phụ thuộc chiều thuận đảo ngược bao gồm một tổ hợp tuyến tính hạn chế của thành phần và một phần bù thêm. Tại một vị trí không gian cụ thể, (x, y), các thành phần ảnh N được biến đổi được thể hiện bằng W0, W1,…, WN-1. Các thành phần bù dc được đưa ra bởi o0, o1, … , oN – 1,, và các thành phần mà kết quả của sự biến đổi được biểu hiện bằng C0, C1,…, CN-1. Biến đổi phụ thuộc chiều thuận được xác định bởi các thiết lập sau đây của phương trình. Biến đổi phụ thuộc chiều thuận được xác định bởi các thiết lập sau đây của phương trình và minh họa trong hình J.12:
Độ lệch o0, o1, …, oM – 1 là giá trị số nguyên và được bao gồm trong một phân đoạn nhãn MCT. Chỉ số ma trận độ lệch được cung cấp bởi trường Tmcci đối với tập hợp thành phần này phải phù hợp với chỉ số ma trận MCT. Nếu các tất cả các độ lệch đều bằng không, thì trường Tmcci đối với tập hợp thành phần này có thể được đặt bằng không và các độ lệch không cần phải được bao gồm trong một phân đoạn nhãn MCT.
Hệ số tij đối với biến đổi nghịch được bao gồm trong các phân đoạn nhãn MCT nói chung là giống như những xuất hiện trong phương trình biến đổi chiều thuận. Có những hạn chế về các giá trị hệ số, Tuy nhiên. Đặc biệt, tất cả tij phải là giá trị số nguyên, và tii đối với i = 1, 2,…, N-1 phải là chính xác số mũ cơ số 2. (Đó là không có hệ số t00; phương trình biến đổi giả định là tương đương với 1.) tii có thể được hiểu là yếu tố độ lớn đối với các bước trong sự biến đổi.
Hình J.12- Biến đổi phụ thuộc đảo ngược chiều thuận
J.3.2 Biến đổi trên cơ sở sóng con
Mục này mô tả một quá trình không phụ thuộc trên cơ sở sóng con. Các phân đoạn nhãn MCC cho phép đặc điểm kỹ thuật của một biến đổi sóng con để được áp dụng cho đầu vào thành phần thứ i tập hợp thành phần thông qua các tham số điểm đánh dấu Xmcci (xem A.3.8). Trong thực tế, nó có thể sử dụng trên cơ sở sóng con phụ thuộc trên một trong những tập hợp thành phần và dựa trên ma trận phụ thuộc trên trong đoạn đánh dấu cùng một MCC. Khi sóng con dựa trên phụ thuộc được sử dụng, một phân đoạn nhãn ATK (xem A.3.5) chỉ định biến đổi hạt nhân sóng con được sử dụng trong xử lý các tập hợp thành phần.
Tham số Tmcci trong phân đoạn nhãn MCC có một chỉ số chỉ định mà ATK phân đoạn nhãn là để được sử dụng cho tập hợp thành phần thứ i. Tham số Tmcci cũng bao gồm một chỉ số điểm cho một phân đoạn nhãn MCT có độ lệch thêm để áp dụng cho các thành phần trung gian sau khi biến đổi sóng con hướng ngược xử lý. Các phân đoạn nhãn MCC báo hiệu số mức biến đổi sóng con trong Tmcci, và một thành phần bù Omcci được sử dụng xử lý trong biến đổi sóng con hướng ngược.
Đối với một biến đổi phụ thuộc dựa trên sóng con, số lượng đầu vào thành phần, N = Nmcci, phải bằng số lượng các thành phần đầu ra, M = Mmcci.
J.3.2.1 Biến đổi sóng con đa chiều thuận nghịch
Mẫu thành phần Cj được thể hiện bởi Cj(x, y). Ở bất kỳ điểm, (x, y) nào, NL + 1 ma trận hai chiều được tạo thành. Ở đây, NL là số mức độ biến đổi sóng con áp dụng cho tập hợp thứ i như được xác định từ tham số đánh dấu Tmcci. Các ma trận được thể hiện bởi . Trong mỗi trường hợp, tbx0 □ u < tbx1, Ở đó tbx0 và tbx1 được xác định thích hợp đối với băng con ab được chỉ định trong phụ lục B of ITU-T Rec. T.800 | ISO/IEC 15444-1. Đối với mục đích của phụ lục này, Giả thuyết rằng biến đổi áp dụng cho thành phần khối ảnh với góc trái phía trên ở (tcx0, tcy0) = (Omcci,0) và phía dưới góc phải ở (tcx1 – 1, tcy1 – 1) = (Omcci + M – 1, 0).
Mẫu (tbx1, tbx0) của mỗi ma trận, ab(u, 0), được lấy từ N = M mẫu Cj(x, y), j = [0, 1, …, N – 1]. Tất cả được lấy từ ma trận nói trên. Đặc biệt, cho b = NLLL. Thì đầu tiên tbx1 – tbx0 = tNLLLx1 – tNLLLx0 mẫu của Cj(x, y), (i.e., j = [0, 1, … , tbx1 – tbx0 – 1]) thành các mẫu ab(u, 0), u = [tbx0, … , tbx1 – 1]. Tương tự, cho b = NLHL. Thì sau đó tbx1 – tbx0 = tNLHLx1 – tNLHLx0 Các mẫu của Cj(x, y) thành các mẫu của ab(u, 0), u = [tbx0, …, tbx1 – 1], và tiếp tục.
Các ma trận ab định nghĩa ở trên được coi như băng con là biến đổi sóng con hướng ngược bằng cách sử dụng hai chiều IDWT như mô tả trong phụ lục F của ITU-T vị T.800 | Tiêu chuẩn ISO/IEC 15444-1 (với tiện ích mở rộng được chỉ định trong phần phụ lục G và H). Kết quả của quá trình biến đổi hướng ngược này là các ma trận hai chiều i(z, 0), ở đó z = [Omcci, Omcci + 1, … , Omcci + M-1]. Ma trận này đại diện cho sự biến đổi sóng con hướng ngược của tập hợp thành phần thứ i trong giai đoạn biến đổi thứ k. Các giá trị của i(z, 0) là các mẫu (tại không gian vị trí (x, y)) của thành phần biến đổi hướng ngược Wj, nơi j = [0, 1, … , M-1]. Cụ thể, Wj (x, z) = I (j + Omcci, 0).
J.3.2.2 Biến đổi sóng con đa chiều hướng thuận (thông tin)
Những gì tiếp theo, chúng ta giả định một tập hợp các thành phần cụ thể, i, để biến đổi bằng biến đổi sóng con nhiều thành phần chiều thuận. Các thành phần trong tập hợp này được biểu hiện bằng Wj, j = [0, 1,…, M-1]. Các thành phần này được biến đổi để có được một tập hợp các thành phần, Cj, j = [0, 1,…, N-1]. Đối với biến đổi sóng con không phụ thuộc, yêu cầu N = M.
Các thành phần của tập hợp này được biến đổi vị trí không gian theo vị trí không gian. Quá trình biến đổi này một chiều. Tuy nhiên, nó có thể được mô tả bằng cách sử dụng biến đổi sóng con hai chiều của phụ lục F của ITU-T vị T.800 | Tiêu chuẩn ISO/IEC 15444-1 với sửa đổi và tiện ích mở rộng như được ghi trong phụ lục H này.
Mẫu của thành phần Wj được thể hiện như Wj(x, y). Ở mỗi vị trí (x, y), ma trận hai chiều được tạo ra.
Ma trận này được xây dựng như l(z + Omcci, 0) = Wz(x, y), ở đó z = [0, 1, … , M – 1], Ma trận này là một mẫu cao, Điều này rất hiệu quả sối với mạng một chiều. Vì thế, có thể xử lý như là hai chiều đối với mục đích mô tả ngắn gọn biến đổi sóng con nhiều thành phần.
Thủ tục biến đổi FDWT (từ phụ lục F của ITU-T vị T.800 | ISO/IEC 15444-1 với sửa đổi và tiện ích mở rộng được chỉ định trong phần phụ lục G và H) được áp dụng cho các ma trận i(z, 0). Đối với mục đích này, i(z, 0) phải được coi là một thành phần khối ảnh ở góc trên bên trái tại (tcx0, tcy0) = (Omcci, 0) và góc phải phía dưới tại (tcx1-1, tcy1-1) = (Omcci + M-1, 0).
Sử dụng ký hiệu của ITU-T Rec. T.800 | ISO/IEC 15444-1, đầu ra của thủ tục FDWT là NL + 1 băng con (Toàn bộ băng con của dạng alevHH và alevLH là rỗng.) Ở đây, NL là số lượng mức độ phân tách được áp dụng. Giá trị này có thể đặt trong trường Tmcci đối với tập hợp thành phần thứ I trong giai đoạn biến đổi hiện tại (i.e., kth).
Với mỗi băng con có các mẫu ab(u, 0), tbx0 □ u < tbx1 với tbx0 và tbx1 xác định trong phụ lục B của ITU-T Rec. T.800 | ISO/IEC 15444-1. Mẫu của các băng con này sau đó được giải thích như là mẫu của các thành phần biến đổi, Cj, j = [0, 1, … , N – 1], ở mỗi vị trí (x,y). tức là, [C0(x, y), C1(x, y), … , CN – 1(x, y)] = . Trong mỗi trường hợp, tbx0 và tbx1 có giá trị áp dụng cho băng con được chỉ ra trong chỉ số dưới của ab.
Phục lục K
(Quy định)
Biến đổi phi tuyến
(Phụ lục là phần tích hợp với tiêu chuẩn)
Trong phụ lục này và các điều nhỏ của phụ lục, các biểu đồ và bảng chỉ có tính quy định trong trường hợp chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này mô tả một phần mở rộng của ITU-T vị T.800 | Tiêu chuẩn ISO/IEC 5444-1 có thể được sử dụng đơn thuần hoặc kết hợp với bất kỳ của các phần mở rộng khác trong tiêu chuẩn này. Khả năng của dòng mã được xác định bởi tham số phân đoạn nhãn kích thước Rsiz (xem A.2.1).
Phụ lục này xác định hai biến đổi điểm phi tuyến được sử dụng sau quá trình giải mã và biến đổi nhiều thành hướng ngược để ánh xạ giá trị dựng lại trong phạm vi thích hợp của chúng. Sự biến đổi phi tuyến chiều thuận có thể sử dụng bởi bộ mã hóa trước khi áp dụng trước nhiều thành phần biến đổi để tăng hiệu suất nén của dữ liệu ảnh gốc tuyến tính hoặc gần tuyến tính ví dụ, một ứng dụng chụp dữ liệu ảnh ban đầu từ một bộ cảm biến với một phản ứng tuyến tính có thể áp dụng sự biến đổi phi tuyến phía trước để sửa chữa các dữ liệu như vậy mà việc phân bổ các bit phù hợp với ảnh nhạy cảm.
K.1 Báo hiệu sử dụng biến đổi phi tuyến
Việc sử dụng biến đổi phi tuyến được báo hiệu trong tham số Rsiz (xem A.2.1).
K.1.1 Phục dựng các thành phần đã giải mã
Các biến đổi phi tuyến tính được chỉ định trong phụ lục này là “điểm” biến đổi. Những biến đổi được áp dụng cho mỗi mẫu (“điểm”) trong một thành phần nhất định. Các biến đổi không trải dài thành phần như các biến đổi nhiều thành phần được mô tả trong phụ lục J. chúng có thể được sử dụng, Tuy nhiên, cùng với các biến đổi thành phần nhiều. Hình K.1 cho thấy nơi ở các chuỗi xử lý giải mã biến đổi phi tuyến tính được áp dụng. Ngược lại, ở phía bộ mã hóa phi tuyến tính biến đổi sẽ được áp dụng trước khi biến đổi không phụ thuộc và phụ thuộc và xử lý sóng con.
Hình K.1- Ứng dụng biến đổi phi tuyến trong quá trình giải mã
Biến đổi chiều thuận (trong quá trình mã hóa) thành phần ảnh nguyên bản (Zi) thành đầu vào của biến đổi nhiều thành phần .Biến đổi chiều nghịch (quá trình giải mã) biến đổi thành phần ảnh phục dựng thành thành phần mã hóa hoàn toàn (Zi).
K.1.2 Độ sâu bít và tương tác với biến đổi nhiều thành phần
Nếu một biến đổi nhiều thành phần được sử dụng trong một dòng mã, Phân đoạn đánh dấu SIZ (xem A.2.1) không còn mang số lượng các thành phần ảnh dựng lại và độ sâu bit của chúng. Thay vào đó, các phân đoạn nhãn SIZ chứa số lượng các thành phần dòng mã và độ sâu bít của chúng (thành phần Ri trong hình K.1). Xử lý của dòng mã thành phần với các biến đổi hướng ngược không tương quan và phụ thuộc có thể tăng hoặc giảm số lượng các thành phần ảnh dựng lại liên quan đến số lượng các thành phần dòng mã. Ngoài ra, độ sâu bít của các thành phần ảnh dựng lại có thể khá khác nhau từ những các thành phần dòng mã. Đối với những lý do này, một phân đoạn nhãn CBD (xem A.3.6) luôn luôn bao gồm trong dòng mã bất cứ khi nào một biến đổi nhiều thành phần được sử dụng. Đoạn CBD đánh dấu có chứa số lượng các thành phần ảnh dựng lại và độ sâu bit của chúng.
Nếu một biến đổi nhiều thành phần được sử dụng kết hợp với biến đổi điểm phi tuyến, đoạn đánh dấu CBD đặt trong dòng mã sẽ chỉ định số thành phần ảnh dựng lại và độ sâu bit của chúng trước khi xử lý thông qua việc biến đổi phi tuyến tính. Nếu không có biến đổi nhiều thành phần được sử dụng, thì SIZ đánh dấu sẽ cho biết số lượng các thành phần ảnh dựng lại và độ sâu bít của chúng.
K.1.3 Biên dịch nhãn
Bất kể việc sử dụng biến đổi nhiều thành phần, một điểm phân đoạn nhãn NLT (xem A.3.10) được đặt trong dòng mã bất cứ khi nào một biến đổi phi tuyến tính được sử dụng. Đoạn NLT đánh dấu cho biết độ sâu bít của các thành phần giải mã mà kết quả từ việc áp dụng một biến đổi phi tuyến tính cho một thành phần ảnh dựng lại. Với những thành phần ảnh dựng lại ảnh mà không phải trải qua một biến đổi phi tuyến tính có trách nhiệm không có thay đổi trong độ sâu bít của chúng.
K.2 Các đặc tính biến đổi phi tuyến
Tiêu chuẩn này cho phép cho sự biến đổi phi tuyến tính được lưu trữ trong hai hình thức khác nhau. Các hình thức tông màu – kiểu không tuyến tính xác định biến đổi thông qua các tham số cho một phương trình, và được chỉ định trong K.2.1. Các hình thức LUT-kiểu không tuyến tính chỉ định sự biến đổi bằng cách chỉ định một tập hợp các cặp bảng tin kiếm và được chỉ định trong K.2.2.
K.2.1 Hệ số độ sáng phi tuyến
Sự biến đổi hệ số độ sáng đặc tả phép biến đổi phi tuyến sử dụng các phương trình toán học. Biến đổi đó được xác định bằng cách sử dụng hai chức năng đoạn: một khu vực tuyến tính cho giá trị thành phần nhỏ, và một vùng hàm mũ cho giá trị lớn thành phần. Sự biến đổi thực tế được lưu trữ trong các phân đoạn nhãn NLT bình thường mà giá trị tối đa của các thành phần đầu vào và đầu ra là + 1.
K.2.1.1 Hệ số độ sáng phi tuyến hướng thuận (mã hóa, thông tin)
Mối quan hệ giữa một giá trị bình thường của thành phần đầu vào Zi và giá trị bình thường y của thành phần điều chỉnh tông màu được đưa ra bởi phương trình K-1. Bộ mã hóa sử dụng mở rộng không tuyến tính sẽ dùng thành phần như là đầu vào của biến đổi nhiều thành phần chiều thuận, hoặc trực tiếp đối với biến đổi sóng con chiều thuận nếu biến đổi nhiều thành phần không được sử dụng. Giá trị z và giá trị y được bình thường để giá trị lớn nhất của thành phần Zi và tương ứng bằng +1.
Trong phương trình K-1 S là độ dốc tại gốc, T là ngưỡng dốc, E là số mũ gamma, và A và B là tham số liên tục. Các tham số được lưu trữ trong đoạn NLT đánh dấu trong hình thức bình thường mà giá trị tối đa của các thành phần đầu vào và đầu ra là + 1.
K.2.1.2 Hệ số độ sáng phi tuyến thuận nghịch (thông tin)
Khi giải mã một dòng mã, Một bộ đọc thích hợp được áp dụng biến đổi được chỉ ra trong phương trình K-2 với mỗi thành phần mà chỉ ra, thông qua phân đoạn nhãn NLT, mà nó phải được xử lý sử dụng kiểu tông màu không tuyến tính. Nhưng công thức làm bình thường giá trị y’ và giá trị thành phần như là đầu vào và sản sinh giá trị bình thường z của thành phần giả mã hoàn toàn Zi như là đầu ra. Bít độ sâu của giá trị bình thường được chỉ trong bởi phân đoạn nhãn CBD, hoặc bởi phân đoạn nhãn SIZ nếu mở rộng nhiều thành phần không được sử dụng. Độ sâu bít của giá trị không bình thường Zi được chỉ ra bởi trường BDnlt trong phân đoạn nhãn NLT.
Các tham số T, S, E, A, và B toàn bộ kết bối với phân đoạn nhãn NLT. Biến đổi có thể được áp dụng đối với các giá trị thành phần không bình thường bởi hệ số mở rộng của phương trình K-2 trùng với độ sâu bit thực tế của thành phần Zi và . Để mở rộng hệ số bình thường đối với dạng không bình thường để biến đổi đầu vào thành phần của độ sâu bít by trực tiếp tới thành phần đầu ra Zi của độ sâu bit bz không cần giá trị thành phần đầu tiên và giá trị không bình thường Zi, hệ số phải được biến đổi như phương trình sau đây K-3 và K-4.
Giá trị by được đưa ra từ phân đoạn nhãn SIZ hoặc CBD thích hợp. Giá trị bz được báo hiệu trong trường BDnlt của phân đoạn nhãn NLT. Một hệ số mở rộng thích hợp, Phương trình K-5 có thể áp dụng trực tiếp đối với dữ liệu ảnh nguyên đối với thành phần và thủ tục dữ liệu ảnh nguyên đối với thành phần Zi.
K.2.2 Biến đổi phi tuyến thuận nghịch loại LUT
Một đường cong phi tuyến thường có thể xấp xỉ bởi một ma trận điểm hàm tuyến tính. Đoạn đánh dấu NLT cung cấp một cơ chế để xác định một không tuyến tính như vậy. Phương pháp này được gọi là một “kiểu tìm kiếm trong bảng LUT không tuyến tính” vì hai lý do. Trước tiên, từ những thông tin cụ thể có thể để xây dựng một bảng nhìn lên để thực hiện việc chuyển đổi. Thứ hai, nếu số lượng giá trị bảng được chỉ định bằng số lượng giải mã giá trị có thể, sau đó một LUT chắn chắn được xác định. Trong khi nó có thể để xác định tương đối tông màu – kiểu không tuyến tính chỉ định K.2.1, cơ chế này cho phép cho các biến đổi khác mà không thể được xác định bằng cách sử dụng chức năng tông màu đơn.
Bảng LUT-kiểu không tuyến tính yêu cầu rằng một danh sách các giá trị bảng được cung cấp. Số lượng khả năng tối đa của giá trị LUT đối với bảng để sản sinh thành phần Zi từ thành phần là , hoặc đó by là số bit sử dụng để thể hiện thành phần (Như là chỉ định bởi đánh dấu CBD Nếu biến đổi nhiều thành phần được sử dụng, phân đoạn SIZ (xem A.2.3) CBD Nếu biến đổi nhiều thành phần không được sử dụng). Giá trị đầu vào tối thiểu và tối đa của LUT bình thường là Dmin và Dmax , tương ứng, khi danh định hóa bao gồm dịch và quy mô tuyến tính linear để giá trị dải của thành phần 0 đến +1, không phụ thuộc vào thành phần là có dấu hay không có dấu.
Đánh dấu NLT chỉ ra một tổng của giá trị Npoints, Trong đó 2 ≤ Npoints ≤ N. Các giá trị này thực tế phân phối qua dải đầu vào Dmin đến Dmax. Giá trị bảng Tk (ở đó k = 0, 1, …, Npoints – 1) biểu thị đầu ra của boeesn đổi hướng ngược đối với giá trị Dk. Giá trị Dk được xác định hoàn toàn bằng Dmin, Dmax, và Npoints thông qua phương trình sau:
Giá trị bảng LUT thực tế được xác định trong bình thường, dạng dịch, với dải của hai thành phần đầu vào và đầu ra là 0 đến +1, không phụ thuộc vào thành phần là số có dấu hay không dấu.
Giá trị của của thành phần đầu vào (y’) được danh định hóa như sau trước khi xử lý thông qua LUT:
Nếu y‘norm < Dmin thì y‘norm sẽ được gán cho Dmin. Nếu y‘norm > Dmax , thì y‘norm gán cho Dmax. Giá trị bình thường của thành phần đầu ra Zi được xác định bởi các phương trình sau:
Ở đó k là số nguyên đầu tiên tức là Dk ≤ y‘norm < Dk+1. Giá trị bình thường cuối cùng của thành phần Zi được xác định bởi các phương trình sau:
ở đó bz is là độ sâu bít của thành phần đầu ra Zi và được báo hiệu trong tham số BDnlt của phân đoạn nhãn NLT. Ccs tham số, Npoints, Dmin, Dmax, ma trận của giá trị Tk và bt được báo hiệu trong phân đoạn nhãn NLT. Bt được lưu trong phân đoạn nhãn NLT trong trường PTval. Ma trận giá trị Tk được lưu trong trường T giá trị s.
Phụ lục L
Miền quan tâm mã hóa và rút trích, phần mở rộng
(Quy định)
(Phụ lục là phần tích hợp với tiêu chuẩn)
Trong phụ lục này và các điều nhỏ của phụ lục, các biểu đồ và bảng chỉ có tính quy định trong trường hợp chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này mô tả một phần mở rộng để Tiêu chuẩn ITU-T T.800 | ISO/IEC 15444-1 có thể được sử dụng đơn thuần hoặc kết hợp với bất kỳ của các phần mở rộng khác trong tiêu chuẩn này. Khả năng của dòng mã được xác định bởi tham số phân đoạn nhãn kích thước Rsiz (xem A.2.1).
Phụ lục này miêu tả công nghệ vùng quan tâm (ROI). Một ROI là một phần của một ảnh được mã hóa với độ trung thực cao hơn so với phần còn lại của nó (phần nền). Sự mã hóa cũng được thực hiện cho thông tin liên quan tới ROI trước thông tin liên quan tới phần nền. Phương pháp được sử dụng (và đã được miêu tả trong phụ lục này) là phương pháp dựa trên thang điểm.
L.1. Giải mã ROI
Các quy trình được quy định tại mục này chỉ được áp dụng trong trường hợp có phân đoạn nhãn RGN, xem A.2.5 (chỉ ra sự có mặt của một ROI được mã hóa bằng phương pháp thang điểm).
Quy trình sắp xếp lại các bít quan trọng của hệ số ROI và các hệ số phần nền. Nó được xác định bằng cách sử dụng các bước sau:
1) Nhận được thông tin hình dạng và giá trị thứ bậc tương ứng, s, từ phân đoạn nhãn RGN cho mỗi ROI. Các bước 2-6 sau đây được áp dụng cho từng hệ số (u,v) của băng con b.
2) Tạo ra mặt nạ ROI {Mi(u,v)} cho tất cả ROI, xem L.3 để biết thêm chi tiết về cách tạo ra mặt nạ ROI ra sao.
3) Đối với mỗi khối mã hóa tìm giá trị thứ bậc lớn nhất, Smax cho bất kỳ hệ số (u,v) nào.
4) Đối với mỗi hệ số trong mọi khối mã hóa tìm giá trị thứ bậc cao nhất và thiết lập s(u,v) để:
s(u, v) = sMax – max(si . Mi (u, v))
Trong đó: i=0…số lượng của ROI-1.
5) Đối với mỗi hệ số (u,v) loại bỏ những MSO s(u,v) đầu tiên và chuyển lên các vị trí MSB s(u,v) còn lại, như được mô tả trong phương trình L-2, với i=1,…, Mb
6) Cập nhật giá trị của Nb(u, v) như được đưa ra trong phương trình L-3.
Nb(u, v) = max(0, Nb(u, v) – s(u, v)) (L-3)
L.2 Mô tả phương pháp tỷ lệ
Mục này miêu tả cách mã hóa một ảnh với một hoặc nhiều ROI. Sự mã hóa được đưa ra ở đây như kiểu phần thông tin. Tuy nhiên, thất bại trong việc tạo ra mặt nạ ROI chuẩn ở phía bộ mã hóa sẽ làm giảm đi đáng kể chất lượng của ảnh được giải mã và sẽ không cho phép giải mã không tổn hao dữ liệu.
L.2.1 Mã hóa với ROI (thông tin)
Ở phía bộ mã hóa một mặt nạ ROI được tạo ra với hệ số chuyển đổi lượng từ phải được mã hóa với chất lượng tốt hơn (đến mức không mất dữ liệu). Mặt nạ ROI là một bản đồ bit mô tả các hệ số cho một ROI. Xem chi tiết cách mặt nạ được tạo ra tại L.3.
Các hệ số chuyển đổi lượng tử được sắp xếp (scaled) theo cách sao cho tầm quan trọng tương đối của mỗi hệ số chuyển đổi bằng với giá trị thứ bậc quy định, s, của ROI được áp dụng. Nếu một hệ số chuyển đổi thuộc nhiều ROI thì giá trị s lớn nhất được chọn. Nếu hệ số chuyển đổi thuộc phần nền thì giá trị thứ bậc s bằng 0. Trước khi sắp xếp các hệ số chuyển đổi lượng tử của một khối mã, giá trị mức cao nhất, sMax, và thấp nhất, sMin, cho khối mã hóa được tìm thấy.
Xem xét một hệ số chuyển đổi lượng tử, qb(u,v), trong khối mã hóa hiện tại với giá trị sắp xếp lượng tử, s (trong đó sMin ≤ s ≤ sMax). Sau khi sắp xếp, các bít riêng lẻ của qb(u, v) lên tới các mặt phẳng bit abs(sMax-s) thấp hơn các bit tương ứng của một hệ số với s = sMax. Số lượng các bít cho khối mã hóa này do đó sẽ tăng lên khoảng (sMax-sMin) bit.
Khi các khối mã hóa được xử lý độc lập, hệ số chuyển đổi lượng tử thuộc cùng ROI có thể kết thúc tại các mức quan trọng khác nhau trong các khối mã hóa khác nhau. Sự khác nhau này giữa các khối mã hóa phải được thực hiện bởi bộ cấp phát tốc độ. Ví dụ cho điều này, nếu một khối mã hóa thuộc ảnh nền và khối mã hóa khác có cả các hệ số nền và hệ số ROI. Trong trường hợp này, các hệ số nền trong khối mã hóa thứ hai sẽ được hạ xuống s-0 bước trong khi đó ở khối mã hóa thứ nhất không có sự chuyển dịch nào diễn ra. Trong trường hợp này các thuật toán phân bổ tỷ lệ để đảm bảo các mặt phẳng bit từ hai khối mã hóa được đưa vào trong dòng bit theo đúng trình tự.
Khi bộ mã hóa ngẫu nhiên mã hóa các hệ số chuyển đổi lượng tử, mặt phẳng bit liên quan tới ROI được mã hóa trước hoặc tại cùng một thời điểm với thông tin liên quan tới nền. Giá trị tỷ lệ, si, cho mỗi ROI được xác định bởi người sử dụng/ứng dụng.
Phương pháp có thể được miêu tả sử dụng các bước sau cho một thiết lập n ROI:
– Đối với mỗi khối mã hóa trong mỗi thành phần:
1) Mặt nạ ROI chung cho tất cả ROI i, {Mi (u, v)}, xem L.3.
2) Tìm thấy sMin và sMax, trong đó sMin và sMax là giá trị tỷ lệ thang nhỏ nhất và lớn nhất trong khối mã hóa hiện tại.
3) Thêm các LSB sBlock = sMax – sMin cho mỗi hệ số |qb(u, v)|. Số lượng M‘b của mặt phẳng bit cho mỗi băng con, b, sau đó sẽ là:
M‘b = Mb + sblock (L-4)
Trong đó: Mb được đưa ra trong ITU-T Rec. T.800 | ISO/IEC 15444-1, phương trình E-2, và giá trị mới của mỗi hệ số được đưa ra bởi:
(L-5)
4) Đối với mỗi hệ số trong từng khối mã hóa tìm thấy giá trị tỷ lệ thang cao nhất và được thiết lập s(u, v) từ:
s(u, v) = sMax – max(si – Mi(u, v)) (L-6)
Trong đó i=0…tới số ROI-1.
5) Tỷ lệ giảm tất cả các hệ số để:
(L-7)
6) Đối với mỗi ROI giá trị tỷ lệ, s, hình dạng, và các điểm tham chiếu trong luồng mã sử dụng phân đoạn nhãn RGN như được miêu tả trong A.2.5.
L.3 Tạo mặt nạ miền quan tâm
Để đạt được một ROI với chất lượng tốt hơn so với phần còn lại của ảnh trong khi vẫn duy trì một số lượng nén hợp lý, các bít cần được lưu bằng cách gửi ít thông tin cho phần nền. Để làm được điều này một mặt nạ ROI cần được tính toán. Mặt nạ là một mặt phẳng bit chỉ ra một tập hợp các hệ số chuyển đổi lượng tử có mã hóa đủ để bên nhận phục dựng lại các vùng mong muốn với chất lượng tốt hơn phần nền (lên tới mức không tổn thất gì).
Để minh họa cho khái niệm việc tạo mặt nạ ROI; ta giới hạn chỉ có một ROI duy nhất và một thành phần ảnh duy nhất, xác định các mẫu thuộc ROI trong phạm vi ảnh đó bởi một mặt nạ nhị phân, M(x, y), trong đó:
Mặt nạ là một bản đồ ROI trong miền sóng con nhờ đó nó có một giá trị khác không bên trong ROI và bằng không bên ngoài ROI. Trong mỗi bước, từng băng con của mặt nạ được cập nhật sau đó theo từng dòng và sau đó theo từng cột. Mặt nạ sẽ chỉ ra các hệ số cần thiết tại bước này để chuyển đổi hướng ngược phục dựng các hệ số mặt nạ trước đó.
Ví dụ, bước cuối cùng của sự chuyển đổi hướng ngược là một thành phần của hai băng con thành một. Sau đó để theo dõi các bước nhảy trước này, hệ số của cả hai băng con cần được tìm thấy. Bước trước đó là một thành phần của bốn băng con thành hai. Để theo dõi các bước nhảy trước này, các hệ số của cả bốn băng con cần được cung cấp sự phục dựng các hệ số một cách hoàn hảo bao gồm trong mặt nạ cho hai băng con được tìm thấy.
Tất cả các bước sau đó được theo dõi ngược trở lại để cung cấp cho mặt nạ. Nếu các hệ số tương ứng với mặt nạ được truyền và nhận, và việc chuyển đổi hướng ngược được tính toán, ROI mong muốn sẽ được phục dựng với chất lượng tốt hơn so với phần ảnh còn lại (tới mức không tổn hao gì nếu các hệ số ROI được mã hóa toàn bộ).
Phần dưới đây miêu tả cách thức mở rộng mặt nạ bị thu hồi trong trường hợp hình chữ nhật hoặc hình elip và cách này được thực hiện với các bộ lọc khác nhau. Các phương pháp tương tự có thể được sử dụng cho các bộ lọc khác.
L.3.1 Tạo mặt nạ hình chữ nhật trên lưới tham chiếu
Mặt nạ hình chữ nhật được miêu tả trong mục này được tạo ra trên lưới điện tham chiếu. Khi tạo ra trên lưới điện tham chiếu các phương pháp được miêu tả trong L.3.4 và L.3.5 được sử dụng cho tạo ra mặt nạ trong miền sóng con. Một hình chữ nhật được miêu tả bởi bốn tham số, xem Hình L.1, tất cả tín hiệu trong RGN được đánh dấu, xem A.2.5. Các tham số là ((XArgn, YArgn, XBrgn, YBrgn) trong đó XArgn và Yargn là bù x và bù y của góc phía trên bên trái của hình chữ nhật từ mạng lưới điện tham chiếu, tương ứng; Ybrgn là chiều cao của hình chữ nhật, XBrgn là chiều rộng của hình chữ nhật.
Mặt nạ chính xác cho lưới điện tham chiếu được đưa ra bởi công thức L-9:
Hình L.1- Các mặt nạ hình chữ nhật trên lưới tham chiếu
L.3.2 Tạo mặt nạ hình elip trên lưới tham chiếu
Mặt nạ hình elip được miêu tả trong mục này được tạo ra trên lưới điện tham chiếu. Khi tạo ra trên lưới điện tham chiếu các phương pháp được miêu tả trong L.3.4 và L.3.5 được sử dụng cho tạo ra mặt nạ trong miền sóng con. Một hình elip được miêu tả bởi bốn tham số, xem Hình L.2, tất cả tín hiệu trong RGN được đánh dấu, xem A.2.5. Các tham số là ((XArgn, YArgn, XBrgn, YBrgn) trong đó XArgn và Yargn là bù x và bù y của tâm hình elip từ mạng lưới điện tham chiếu, tương ứng; Ybrgn là chiều cao của elip, XBrgn là chiều rộng của hình elip.
Mặt nạ chính xác cho lưới điện tham chiếu được đưa ra bởi công thức L-10:
YBrgn2 · (x – XArgn)2 + XBrgn2 · (y – YArgn)2 ≤ XBrgn2 · YBrgn2 (L-10)
Do đó, một tọa độ trên lưới tham chiếu thuộc về ROI nếu và chỉ nếu công thức L-10 là đúng.
Hình L.2- Mặt nạ elip trên lưới tham chiếu
L.3.3 Vùng tạo mặt nạ miền quan tâm của các dải bộ lọc đối xứng mẫu đầy đủ
Ngân hàng bộ lọc đối xứng toàn bộ mẫu là một tập hợp con của các ngân hàng bộ lọc lựa chọn tùy thích, tạo ra mặt nạ ROI có thể được miêu tả theo cách tương tự như đối với các ngân hàng bộ lọc lựa chọn tùy thích, xem L.3.4. Khi sử dụng đối xứng toàn bộ mẫu, các thông số được định nghĩa trong H.1.2 được sử dụng.
L.3.4 Vùng tạo mặt nạ miền quan tâm của các dải bộ lọc lựa chọn tùy ý
Sự tạo ra mặt nạ ROI theo sự phân hủy tùy thích của các thành phần cứng như được miêu tả trong Phụ lục F. Tuy nhiên, thay vì phân hủy một thành phần cứng, mặt nạ ROI lại bị phân hủy. Mặt nạ ROI này được xác định trên mạng lưới điện tham chiếu, và là mặt nạ nhị phân hai chiều với các kích thước tương tự như thành phần cứng tương ứng. Mặt nạ ROI có các giá trị khác không tại những mẫu thuộc về ROI và các giá trị bằng không tại những mẫu khác.
Thay vì tính toán các hệ số sóng con sử dụng các bước nâng hạ, như được miêu tả trong phụ lục H, các bước nâng hạ cho sự chuyển đổi sóng con rời rạc hướng ngược được tuân theo thứ tự ngược và trong mỗi bước nâng hạ các hệ số sóng con được sử dụng để phục dựng các hệ số sóng con tương ứng tới những mẫu khác không trong mặt nạ ROI là được tìm thấy. Đối với mỗi bước nâng hạ, mặt nạ ROI được cập nhật để tất cả các mẫu tương ứng với hệ số sóng con có thể được sử dụng nhằm phục dựng các hệ số sóng con tương ứng với các mẫu khác không trong mặt nạ ROI là được thiết lập tới các giá trị khác không. Sự tạo ra mặt nạ cần phải đưa vào tài khoản phân loại của bộ lọc được sử dụng bởi sự chuyển đổi và có sử dụng hoặc không sử dụng sự chuyển đổi SSO. Các trường hợp khác được miêu tả dưới đây.
Điều này được thực hiện bằng cách thay thế phương trình H-4, H-5 và H-7 bằng:
Mặt nạ 1D, được phân hủy, là Rext.
Mỗi bước nâng s trong đó phạm vi s từ 0 tới NLS – 1,
a)
if (Rext(2n + ms) = = 1)
then
(R‘ext(2n + 1 – ms + 2(k + offs))) = 1, for all k = 0,…, Ls – 1
and
R‘ext(2n + ms) = 1
Trong đó là các mẫu trong mặt nạ ROI, tương ứng với Mi(u,v) trong phương trình H-4, H-5 và H-7. R‘ext là Rext sau bước nâng hạ s. Hơn nữa, ms = 1 – ms-1 chỉ ra rằng dù bước nâng hạ thứ s được áp dụng tới các hệ số chỉ mục chẵn (ms = 0) hoặc các hệ số chỉ mục lẻ (ms = 1), trong đó Ls là số lượng hệ số nâng hạ cho bước nâng hạ s.
b)
Rext = R‘ext
L.3.4.1 Chồng lấn mẫu riêng biệt
Được thực hiện bằng cách thay thế phương trình I-12 và I-14 bằng cách:
Đối với mỗi bước nâng hạ s, trong đó s dao động từ 0 đến NLS – 1,
a)
Trong đó R là các mẫu trong mặt nạ ROI, Mi(u,v) tương ứng với V trong các phương trình I-12 và I-14. R là R sau bước nâng hạ s. Hơn nữa, ms = 1 – ms-1 chỉ ra rằng dù bước nâng hạ thứ s được áp dụng tới các hệ số chỉ mục chẵn (ms = 0) hoặc các hệ số chỉ mục lẻ (ms = 1), trong đó Ls là số lượng hệ số nâng hạ cho bước nâng hạ s. NI, p, np VÀ PSEO, p() được định nghĩa trong phụ lục I.
b)
R = R’ (L-14)
Sau khi thực hiện điều này cho tất cả các bước nâng hạ, các mẫu mặt nạ ROI được tách ra thành các băng con theo cùng một cách như với các hệ số sóng con được tách bằng cách sử dụng quy trình giải đan xen dữ liệu được miêu tả trong mục F.4.5 của Tiêu chuẩn ITU-T Rec. T.800 | ISO/IEC 15444-1.
Quy trình này đảm bảo rằng mỗi hệ số đó đã ảnh hưởng đến một hệ số trong ROI trong suốt sự chuyển đổi sóng con hướng ngược có một ‘1’ ở vị trí tương ứng trong mặt nạ ROI.
L.3.5 Tạo nhanh mặt nạ hình chữ nhật (thông tin)
Trong trường hợp ROI hình chữ nhật, mặt nạ có thể được lấy nhanh hơn với các hình dạng tùy ý khác. Trong trường hợp này, thay vì truy vấn mỗi giá trị điểm ảnh và hệ số được phục dựng trong chuyển đổi hướng ngược, chỉ có hai vị trí duy nhất cần được nghiên cứu, cụ thể là góc phía trên bên trái và góc phía dưới bên phải của mặt nạ. Góc phía trên bên trái, (…) trên lưới điện tham chiếu sẽ được đưa ra trong phân đoạn nhãn RGN với … và góc phía dưới bên phải (..) trên lưới điện tham chiếu sẽ đưa ra các tham số trong phân đoạn nhãn RGN với … tương ứng (xem A.3.8). Sự tạo ra mặt nạ phải được đưa vào tài khoản lọc có sử dụng sự chuyển đổi. Tài khoản lọc này có thể được kết hợp với sự chuyển đổi chồng lấn mẫu riêng lẻ.
1) Đối với mỗi bước nâng hạ s, trong đó s dao động từ 0 đến NLS – 1,
2) A) Tìm chỉ số mẫu thấp nhất (2n + ms ≥ x1) trong mặt nạ
3) x‘1 = 2n + 1 – ms + 2offs (L-15)
if (x‘1 > x1):
x‘1 = x1 (L-16)
b) Tìm chỉ số mẫu cao nhất 2n + ms ≤ x2
x‘2 = 2n+1 – ms + 2(Ls – 1 + offs) (L-17)
if (x‘2 > x2):
x‘2 = x2 (L-18)
c) Thiết lập
x1 = x‘1,
x2 = x‘2
Trong đó, ms = 1 – ms-1 chỉ ra rằng dù bước nâng hạ thứ s được áp dụng tới các hệ số chỉ mục chẵn (ms = 0) hoặc các hệ số chỉ mục lẻ (ms = 1), trong đó Ls là số lượng hệ số nâng hạ cho bước nâng hạ s.
Để tất cả các mẫu giữa x1 và x2, bao gồm, khác không và sau đó các mẫu mặt nạ ROI được tách ra thành các băng con theo cùng một cách như với các hệ số sóng con được tách bằng cách sử dụng quy trình giải đan xen dữ liệu được miêu tả trong mục F.4.5 của Tiêu chuẩn ITU-T Rec. T.800 | ISO/IEC 15444-1.
L.3.5.1 Chồng lấn mẫu riêng biệt
Ở mỗi cấp độ phân tách, các bước được mô tả trong L.3.4.1 dưới đây làm thế nào mở rộng mặt nạ.
Cho mặt nạ 1D, để được phân tách, cho R và cho x1 và x2 là chỉ số thấp nhất và chỉ số cao nhất của mẫu không zero trong R.
1) Cho mỗi bước dịch s ở đó s có dải từ 0 đến NLS – 1,
a) Tìm chỉ số mẫu nhỏ nhất (2n + ms ≥ x1)) để trong mặt nạ
b) Tìm chỉ số mẫu lớn nhất 2n + ms < x2
c) Đặt
x1 = x‘1,
x2 = x‘2
Ở đó ms = 1 – ms-1 chỉ ra rằng bước dịch thứ s áp dụng cho hệ số chỉ số chẵn (ms = 0) hoặc hệ số chỉ số lẻ (ms = 1), và khi Lslà is nố hệ số đối với bước dịch s, và khi offs là độ lệch cho mỗi bước dịch s. NI, p, np và PSEO, p() được định nghĩa trong phụ lục I.
Cho tất cả các mẫu giữa x1 và x2, bao gồm không zero và các mẫu mặt nạ ROI tách biệt vào trong sóng con cũng như trong hệ số sóng con được tách biệt bằng cách sử dụng thủ tục interleave mô tả trong F.4.5 của ITU-T Rec. T.800 | ISO/IEC 15444-1.
L.4 Diễn giải mã hóa miền quan tâm
Mục này bao gồm một sự đánh dấu cho trường hợp nhiều thành phần và đánh dấu về độ chính xác của sự thực thi.
L.4.1 Cách sử dụng cùng với phương pháp Maxshnếut được mô tả trong ITU-T T.800 | ISO/IEC 15444-1
Phương pháp Maxshnếut được miêu tả trong ITU-T T.800 | ISO/IEC 15444-1 không được sử dụng cùng với phương pháp được miêu tả trong khuyến nghị|tiêu chuẩn quốc tế này.
L.4.2 Diễn giải nhiều thành phần (thông tin)
Đối với trường hợp ảnh mầu, phương pháp này được áp dụng một cách riêng biệt cho mỗi thành phần mầu sắc. Nếu một vài màu bị giảm tỷ lệ lấy mẫu, mặt nạ cho các thành phần giảm tỷ lệ lấy mẫu này được tạo ra theo cách tương tự như mặt nạ của các thành phần không giảm tỷ lệ lấy mẫu.
L.4.3 Diễn giải độ chính xác thực hiện (thông tin)
Phương pháp mã hóa ROI này trong một vài trường hợp có thể tạo ra các tình huống vượt ra ngoài phạm vi hoạt động. Tuy nhiên tình huống này được giải quyết một đơn giản bằng cách loại bỏ các ma trận bít ít quan trọng mà vượt quá giới hạn do sự hoạt động bị thu hẹp. Kết quả là ROI sẽ có chất lượng tốt hơn so với phần nền, mặc dù toàn bộ dòng bít đều được giải mã. Tuy nhiên nó có thể tạo ra vấn đề khi ảnh được mã hóa với ROI trong mô hình không mất mát dữ liệu. Loại bỏ các ma trận bít ít quan trọng nhất cho phần nền có thể tạo ra việc phần nền không được mã hóa không mất mát dữ liệu; và trong trường hợp xấu nhất phần nền có thể không thể phục dựng lại được tất cả. Điều này phụ thuộc vào phạm vi hoạt động sẵn có.
Phụ lục M
Cú pháp định dạng tập tin mở rộng JPX
(Quy định)
(Phụ lục là phần tích hợp với tiêu chuẩn)
Trong phụ lục này và các điều nhỏ của phụ lục, các biểu đồ và bảng chỉ có tính quy định trong trường hợp chúng xác định một đầu ra mà các triển khai tùy chọn phải tuân thủ. Phụ lục này mô tả một phần mở rộng để Tiêu chuẩn ITU-T T.800 | ISO/IEC 15444-1 có thể được sử dụng đơn thuần hoặc kết hợp với bất kỳ của các phần mở rộng khác trong tiêu chuẩn này.
M.1 Phạm vi định dạng tập tin
Phụ lục này định nghĩa một định dạng tệp tin tùy chọn cho các ứng dụng được chọn để sử dụng cho dữ liệu ảnh dạng nén JPEG 2000. Định dạng này là một phần mở rộng của định dạng tệp tin JP2 được định nghĩa trong Phụ lục I của Tiêu chuẩn ITU-T Rec. T.800 | ISO/IEC 15444-1. Tuy nhiên không phải tất cả các ứng dụng sẽ sử dụng định dạng này, nhiều những ứng dụng khác sẽ được tìm thấy để đáp ứng nhu cầu của nó. Tuy nhiên, những ứng dụng đó sẽ được mô tả trong toàn bộ phụ lục này.
Phụ lục này bao gồm:
1) Chỉ rõ đóng gói nhị phân đối với cả ảnh và siêu dữ liệu;
2) Chỉ rõ cơ chế biểu thị các thuộc tính ảnh, như thang mức âm hoặc khoảng ảnh màu;
3) Chỉ rõ cơ chế các bộ đọc có thể thừa nhận sự tồn tại của thông tin bản quyền sở hữu trí tuệ trong tệp;
4) Chỉ rõ cơ chế siêu dữ liệu (bao gồm thông tin xác định nhà cung cấp) có thể bao hàm trong các tệp được đặc tả bởi tiêu chuẩn này;
5) Chỉ định rõ cơ chế đa dòng mã có thể được kết hợp thành một sản phẩm riêng biệt nhờ các phương pháp như ảnh ghép và ảnh động.
M.2 Giới thiệu về JPX
Theo định nghĩa trong Phụ lục I của tiêu chuẩn này, định dạng tệp tin JP2 cung cấp một phương pháp để các ứng dụng có thể trao đổi các tệp ảnh mà mọi bộ đọc có thể hiểu và hiển thị ảnh. Tuy nhiên, một vài ứng dụng yêu cầu phần mở rộng cho định dạng tệp tin JP2 ngăn cản bộ đọc hiểu đúng. Ví dụ, một ảnh được mã hóa trong thang màu CMYK sẽ không giải thích đúng đắn được cho bộ đọc JP2.
Đặt các phần mở rộng không tương thích vào trong tệp tin JP2 sẽ đưa ra sự nhầm lẫn trên thị trường, đưa ra tình trạng một số bộ đọc có thể hiểu được một vài tệp tin JP2 nhưng một số khác thì không. Vì sự nhầm lẫn này không thể tránh khỏi khi bạn xem xét toàn bộ thiết lập của tất cả cấu hình các ứng dụng, nó phải được tránh trong một số trường hợp, chẳng hạn như trên máy tính để bàn của người tiêu dùng.
Vì thế phụ lục này định nghĩa dạng tệp tin thứ hai được sử dụng trong các ứng dụng yêu cầu phải có chức năng hoặc cấu trúc dữ liệu khác ngoài những quy định trong dạng tệp tin JP2. Định dạng tệp tin này được gọi là JPX.
M.2.1 Nhận dạng tập tin
Các tệp tin JPX có thể được xác định bằng cách sử dụng một số cơ chế. Khi được lưu trữ trong hệ thống tệp tin máy tính truyền thống, tệp tin JPX được gán phần mở rộng “.jpx” (bộ đọc cần cho phép trường hợp hỗn hợp). Trong hệ thống tệp Macintosh, các file JPX nên được thành loại mã hóa ‘jpx\040’.
Tuy nhiên, nếu một tệp tin JPX cụ thể phù hợp với đặc điểm kỹ thuật của bộ đọc JP2 (được chỉ ra bằng cách đặt mã ‘jp2\040’ trong danh sách tương thích trong hộp Loại Tệp tin), sau đó bộ viết của tệp tin đó có thể lựa chọn để sử dụng các phần mở rộng cho định dạng file JP2, theo quy định trong I.2.1 của định dạng file JP2, cho file cụ thể. Điều này sẽ phát huy tối đa khả năng tương thích của tệp tin đó mà không làm mất file xác định (như trường BR trong hộp Loại File sẽ có ‘jpx\040’ cho các file được xác định bởi khuyến nghị\Tiêu chuẩn này).
Trong định dạng file JP2, hộp Loại File cung cấp thông tin bộ đọc file có thể sử dụng để xác định xem nó có khả năng đọc tệp tin không. Hộp này cũng có mặt trong các định dạng file họ JPEG 2000 khác.
M.2.2 Tổ chức tập tin
Như trong các file JP2, một tệp tin JPX đại diện cho một tập hợp các khối. Cấu trúc nhị phân của một tệp tin là một chuỗi liên tiếp của khối. Sự bắt đầu của khối đầu tiên sẽ là byte đầu của tệp tin, và byte sau của khối sau sẽ là byte sau của tệp tin. Nhiều khối được xác định bởi Khuyến nghị\Tiêu chuẩn này. Thêm vào đó, các Khuyến nghị\Tiêu chuẩn khác có thể định nghĩa các khối khác để sử dụng trong các tệp tin JPX. Tuy nhiên, tất cả thông tin chứa trong một tệp tin JPX sẽ trong định dạng khối, các dòng byte không trong định dạng khối sẽ không được tìm thấy trong tệp tin.
Cấu trúc nhị phân của một khối trong tệp tin JPX trùng với định nghĩa định dạng tệp tin JP2 (ITU-T Rec. T.800 | ISO/IEC 15444-1, I.4).
M.2.3 Thang màu xám / đặc tính nhiều thành phần
Định dạng tệp tin JP2 cho phép thang màu của ảnh được xác định theo hai cách (liệt kê hoặc hạn chế ICC). Mở rộng định dạng tệp tin JPX bởi:
– xác định thang màu bổ sung cho phương pháp liệt kê (M.11.7.3.1);
– Xác định một phương pháp để các hãng cung cấp và các cơ quan tiêu chuẩn bổ sung thang màu liệt kê (M.7.3.1);
– Xác định một phương pháp mới cho phép sử dụng bất kỳ đầu vào hồ sơ ICC nào (phương pháp ICC bất kỳ, M.11.7.3.2);
– Xác định phương pháp mới cho phép các hãng cung cấp định nghĩa mã duy nhất cho các thang màu độc lập từ một cơ quan đăng ký (Phương pháp màu cung cấp, M.11.7.3.3);
– Cho phép sử dụng các phần mở rộng của việc chuyển đổi nhiều thành phần và mở rộng chuyển đổi phi tuyến tính trong dòng mã hóa (xem Phụ lục J và K).
M.2.4 Đặc tính của thông tin mờ
Định dạng tệp tin JPX xác định hai phần mở rộng cho thông tin mờ xác định. Đầu tiên, định dạng tệp tin cho phép các kênh mờ được lưu trữ trong dòng mã riêng biệt từ các kênh ảnh màu. Trong các ứng dụng chỉnh sửa ảnh, dữ liệu màu và dữ liệu mở được chỉnh sửa một cách riêng biệt, và do đó nó rất hữu ích cho phép các kênh này được lưu trữ trong các luồng mã hóa riêng biệt. Điều này được miêu tả trong cấu trúc lớp miêu tả trong M.5.
Thứ hai, định dạng tệp tin JPX cho phép đặc điểm kỹ thuật của mẫu trong suốt hoàn toàn đi qua một khóa sắc độ. Định dạng tệp tin xác định một ma trận các giá trị mẫu, một từ mỗi kênh màu. Vị trí ảnh bao gồm sự kết hợp các giá trị mẫu sẽ được coi là trong suốt hoàn toàn. Ví dụ khóa sắc độ có thể được quy định là màu đỏ = 134, xanh lá = 92 và xanh da trời = 47. Bất kỳ vị trí nào kết hợp với giá trị mẫu màu đỏ, xanh lá, xanh da trời sẽ được coi là trong suốt hoàn toàn. Điều này được định nghĩa trong các đặc điểm kỹ thuật của hộp Độ mờ mục M.11.7.6.
M.2.5 Siêu dữ liệu
Ngoài việc xác định dữ liệu ảnh được lưu trữ như thế nào, khuyến nghị|Tiêu chuẩn này còn định nghĩa, trong Phụ lục M, một số yếu tố siêu dữ liệu. Các yếu tố này xác định thông tin như cách ảnh được tạo ra, bị bắt giữ hay được số hóa như thế nào, hoặc cách ảnh được chỉnh sửa từ bản được tạo ra ban đầu. Khuyến nghị| Tiêu chuẩn này cũng bao gồm khả năng xác định thông tin sở hữu trí tuệ, cũng như nội dung của ảnh, chẳng hạn như tên người và địa điểm chụp ảnh.
Thêm vào đó siêu dữ liệu còn được định nghĩa trong Tiêu chuẩn này, các hình thức khác của siêu dữ liệu XML và sự miêu tả (như được định nghĩa trong Phụ lục N), có thể được nhúng vào trong tệp tin JPX trong hộp XML.
Hơn nữa, hộp nhị phân MPEG-7 (được định nghĩa trong mục M.11.19) có thể được sử dụng để lưu trữ siêu dữ liệu định dạng nhị phân MPEG-7 (BiM).
M.2.6 Lưu trữ dòng mã trong JPX
Trong IP2, toàn bộ dòng mã được yêu cầu lưu trữ trong phần tiếp giáp của tệp tin. Tuy nhiên, sự hạn chế này có thể là vấn đề với một số ứng dụng. Các ứng dụng chỉnh sửa ảnh, ví dụ, có thể muốn sửa đổi một lớp riêng của ảnh và viết lớp đã được sửa đổi lên phần cuối của tệp tin mà không cần viết lại tệp tin. Các máy chủ hình ảnh hoặc ứng dụng mạng có thể muốn chia ảnh thành nhiều tệp tin trên các đĩa khác nhau hoặc lan truyền dòng mã thông qua mạng. Định dạng tệp tin JPX cho phép các tính năng này bằng cách chia dòng mã thành từng mảnh. Sự phân mảnh các dòng mã được miêu tả trong mục M.4.
M.2.7 Kết hợp nhiều dòng mã
Ngoài việc xác định kết quả kết xuất như kết quả của việc giải nén dòng mã duy nhất và diễn giải đúng thang màu của dòng mã như được quy định trong định dạng tệp tin JP2, định dạng tệp tin JPX cho phép nhiều dòng mã kết hợp với nhau để tạo ra kết quả được kết xuất. Các dòng mã này có thể được kết hợp theo hai cách: ghép lại và ảnh động. Điều này được mô tả thêm trong mục M.5.
M.3 Thang màu xám / màu/ bảng màu/ kiến trúc đặc tính nhiều thành phần
Định dạng tệp tin JPX xây dựng dựa trên cấu trúc màu linh động được quy định trong định dạng tệp tin JP2. Các đặc tả thang màu được quy định trong các hộp đặc tả màu sắc, được định nghĩa trong JP2. Tuy nhiên JPX mở rộng hộp này (trong giới hạn cấu trúc nhị phân được định nghĩa trong JP2) cho phép sử dụng các phương pháp khác để xác định thang màu, và cho phép lựa chọn bộ đọc từ các đặc tả thang màu khác được tìm thấy trong tệp tin riêng lẻ khi diễn giải một ảnh.
M.3.1 Phần mở rộng cho tiêu đề hướng ngược đặc tính màu
Trong JP2, các trường APPROX và PREC được dành để sử dụng trong tương lai; bộ ghi JP2 yêu cầu ghi các giá trị mặc định vào trong trường này. Trong JPX, các trường này được quy định và có thể sử dụng bởi bộ đọc JPX để lựa chọn sự xử lý thông minh.
Trong cả JP2 và JPX, một trường riêng lẻ có thể chứa nhiều đại diện màu sắc của ảnh. Ví dụ, một ảnh JPX có thể chứa một giá trị liệt kê, một cấu hình ICC hạn chế. Các phương pháp này nhằm tối đa hóa khả năng tương tác cũng như cung cấp truy nhập tối ưu. Trong ví dụ này, giá trị liệt kê cho phép nhận dạng nhanh chóng, cấu hình ICC phức tạp cho phép diễn giải chính xác bằng cách sử dụng cơ chế ICC đầy đủ, và các cấu hình ICC bị hạn chế cho phép bộ đọc ít phức tạp hơn để đưa ra một kết quả “đủ tốt”. Cụ thể, cấu hình ICC bị hạn chế trong ví dụ này gần giống như cấu hình ICC phức tạp. Sự gần như này được xác định trong hộp định danh màu, và cho phép bộ đọc tạo sự tráo đổi khi diễn giải ảnh.
Hộp định danh màu cũng cho phép bộ ghi kết hợp quyền ưu tiên với mỗi phương pháp. Thông tin này quy định một ưu tiên mặc định để xem xét lựa chọn các định danh đa màu sắc trong đó sự đặc tả sẽ được sử dụng để diễn giải các giá trị mã giải nén.
Tuy nhiên, việc sử dụng cả thông tin xấp xỉ và ưu tiên là nằm ngoài phạm vi của Khuyến nghị\Tiêu chuẩn này. Các ứng dụng là miễn phí để xem xét cả hai mẫu thông tin với nhau và để xác định các ưu tiên của nó cho việc lựa chọn phương pháp thang màu được sử dụng khi diễn giải ảnh. Ví dụ, trong chế độ xem trước nhanh, tốc độ quan trọng hơn chất lượng, một ứng dụng có thể muốn sử dụng cấu hình ICC bị hạn chế mặc dù nó có thể sử dụng cấu hình phức tạp hơn.
M.3.2 Mở rộng với phương pháp liệt kê
Định dạng JPX xác định các giá trị liệt kê cho thang màu bổ sung. Ngoài ra, Khuyến nghị Tiêu chuẩn này còn định nghĩa một cơ chế mà theo đó các nhà cung cấp hoặc cơ quan tiêu chuẩn khác có thể đăng ký các giá trị bổ sung cho trường EnumCS trong phương pháp liệt kê. Nhìn chung, không có yêu cầu thực thi nào cho việc định nghĩa bổ sung hay các khoảng màu được đăng ký. Những yêu cầu cho việc giải thích các khoảng cụ thể được định nghĩa trong tệp tin phù hợp.
Thêm vào đó, cấu trúc dữ liệu cho phương pháp liệt kê đã được mở rộng cho phép đặc tả các thông số được định nghĩa một cách chính xác cách khoảng màu cụ thể được mã hóa như thế nào trong tệp tin. Ví dụ, khoảng màu CIELab, được định nghĩa bởi ITU-T. T42 xác định sáu tham số chỉ định phạm vi mã hóa chính xác và độ lệch của dữ liệu được lưu trữ. Để diễn giải đúng đắn một ảnh CIELab, bộ giải mã phải biết thông tin này và áp dụng các tham số đó vào dữ liệu ảnh được giải mã. Các thông số được liệt kê là được quy định riêng cho mỗi khoảng màu liệt kê yêu cầu tham số. Tuy nhiên, nhiều khoảng màu không yêu cầu các tham số bổ sung, do đó tham số bổ sung không được định nghĩa cho khoảng màu đó. Đối với các khoảng màu phải xác định các tham số bổ sung, giá trị mặc định có thể được định nghĩa (ví dụ định nghĩa CIELab và CIEJab). Nếu toàn bộ khối tham số bổ sung không có trong hộp đặc tả màu, thì các giá trị mặc định sẽ được sử dụng; tuy nhiên, nếu tham số bổ sung được quy định cho hộp đặc tả màu cụ thể, thì tất cả các tham số bổ sung cần phải được định nghĩa trong hộp đặc tả màu.
M.3.3 Phương pháp ICC tùy ý
Trong định dạng tệp tin JP2, phương pháp ICC hạn chế đã được định nghĩa, cho phép ảnh được mã hóa trong vùng RGB và khoảng thang màu xám. Tuy nhiên, nhiều khoảng màu, chẳng hạn như khoảng màu CMYK và CIELab, không được đại diện bằng cách sử dụng thiết lập giới hạn các cấu hình ICC cho phép bởi phương pháp ICC hạn chế. JPX nâng giới hạn này bằng cách định nghĩa một phương pháp riêng cho phép cấu hình đầu vào ICC hợp pháp bất kỳ được nhúng vào trong tệp tin. Đây là phương pháp màu sắc riêng biệt hơn với phương pháp ICC hạn chế, nó cũng phù hợp trong tệp tin JPX. Các ứng dụng có thể không sử dụng giá trị ICC METH hạn chế để nhúng vào cấu hình ICC không bị hạn chế.
Trong các định dạng tập tin JP2, phương pháp hạn chế ICC đã được xác định, cho phép ảnh để được mã hóa trong một rộng phạm vi của RGB và greyscale gian. Tuy nhiên, nhiều colourspaces, chẳng hạn như CMYK và CIELab không gian, không thể được đại diện bằng cách sử dụng bộ cấu hình ICC cho phép theo phương pháp hạn chế ICC, bị giới hạn. JPX Thang máy hạn chế này bằng cách định nghĩa một phương thức để cho phép bất kỳ cấu hình ICC hợp lệ đầu vào được nhúng trong tệp. Đây là một phương pháp riêng biệt màu sắc hơn phương pháp hạn chế ICC, cũng là hợp pháp trong một tập tin JPX. Ứng dụng không sử dụng giá trị giới hạn ICC METH cho nhúng không – hạn chế ICC profiles.
M.3.4 Phương pháp cung cấp màu
Trong khi khuyến nghị tiêu chuẩn này định nghĩa một phương pháp mà các khoảng màu mới có thể được đăng ký, phương thức đăng ký là không thích hợp để sử dụng cho việc xác định các mã cho nhà cung cấp cụ thể hoặc các khoảng màu riêng biệt. Để cho phép xác định các khoảng màu này một cách nhanh chóng, chuẩn JPX được định nghĩa như một phương pháp định danh khoảng màu bổ sung, được gọi là Phương pháp màu cung cấp. Phương pháp này rất giống với phương pháp liệt kê, ngoại trừ thay vì sử dụng mã số nguyên 4-byte, phương pháp màu cung cấp sử dụng UUID. Các giá trị UUID này được tạo ra bởi các nhà phát triển ứng dụng khi họ tạo ra định nghĩa khoảng màu riêng biệt.
Điều này phù hợp để xác định giá trị màu cung cấp trong mọi tệp tin JPX. Tuy nhiên, không bộ đọc nào được yêu cầu phải giải thích một cách chính xác ảnh mà chỉ dựa trên phương pháp màu cung cấp. Nếu một bộ ghi ảnh mong muốn tối ưu hóa khả năng tương tác bên ngoài phạm vi mục tiêu ứng dụng, nó nên sử dụng các phương pháp màu bổ sung trong tệp tin (chẳng hạn như phương pháp màu ICC hạn chế và ICC bất kỳ).
M.3.5 Bảng màu
Bảng màu được chỉ định và hoạt động chính xác như được định nghĩa trong các định dạng tập tin JP2. Một bảng ảnh sẽ chứa một hộp bảng màu, chỉ định sự biến đổi từ một thành phần đến nhiều thành phần. Nhiều thành phần được tạo ra bởi các bảng sau đó được diễn giải bởi phần còn lại của kiến trúc màu nếu như chúng đã được lưu trữ trực tiếp trong dòng mã.
M.3.6 Sử dụng nhiều phương pháp
Định dạng tập tin JPX cho phép nhiều phương pháp được nhúng trong một file duy nhất (như trong các định dạng tập tin JP2) và cho phép các tiêu chuẩn khác xác định phần mở rộng cho phương pháp liệt kê và để xác định phương pháp mở rộng. Các bộ đọc cung cấp này phù hợp cho những phần mở rộng lựa chọn như đường dẫn xử lý ảnh nên được sử dụng để giải thích khoảng màu của ảnh.
Nếu tập tin tuân thủ JP2, phương pháp đầu tiên tìm thấy trong các tập tin (trong hộp đặc tả khoảng màu đầu tiên trong hộp tiêu đề JP2) sẽ là một trong những phương pháp được xác định và hạn chế trong các định dạng tập tin JP2. Tuy nhiên, một bộ đọc JPX phù hợp có thể sử dụng phương pháp bất kỳ tìm thấy trong các tập tin.
M.3.7 Tương tác với biến đổi nhiều thành phần không tương quan
Các đặc điểm kỹ thuật của màu sắc trong các định dạng tập tin JPX sử dụng độc lập nhiều thành phần chuyển đổi hoặc chỉnh sửa phi tuyến tính trong dòng mã (các dấu hiện MCT, MCC, MCO và NLT được quy định tương ứng trong A.3.7, A.3.8, A.3.9 và A.3.10). Sự biến đổi khoảng màu chỉ định thông qua chuỗi các hộp đặc tả màu sẽ được áp dụng cho các mẫu ảnh sau khi đảo ngược sự biến đổi nhiều thành phần và điều chỉnh phi tuyến tính đảo ngược đã được áp dụng cho các mẫu giải nén. Trong khi việc áp dụng các biến đổi thành phần đa tương quan là riêng biệt, việc áp dụng một chuyển đổi nhiều thành phần dựa trên mã hóa dựa thường xuyên sẽ cải thiện nén dữ liệu ảnh màu.
M.4 phân mảnh dòng mã giữa một hoặc nhiều tập tin hơn
Tính năng quan trọng khác của định dạng tập tin JPX là khả năng phân mảnh một dòng mã duy nhất trong một tập tin hoặc trên nhiều tập tin. Điều này cho phép các ứng dụng thực hiện các tính năng như:
– chỉnh sửa ảnh, lưu lại các nền được thay đổi vào cuối các tập tin;
– phân phối ảnh trên một số đĩa nhằm truy cập nhanh hơn;
– phân phối ảnh trên internet, cho phép chỉ có một số khách truy cập đến dòng mã có chất lượng cao hoặc độ phân giải cao;
– tái sử dụng các tiêu đề từ trong một dòng mã qua nhiều dòng mã (để giảm thiểu phí tổn tập tin khi lưu trữ các dòng mã tương tự trong cùng một tập tin JPX).
Phân mảnh trong JPX hoạt động bằng cách chỉ định một bảng của các liên kết đến các phân mảnh cá nhân. Mỗi liên kết chỉ định ba điều:
– Các tập tin được chứa trong phân mảnh đó. Bởi vì nhiều mảnh trên nhiều dòng mã có thể được lưu trữ trong cùng một tập tin, các định dạng đóng gói tất cả dữ liệu tên tập tin/URL vào một bảng (hộp tham chiếu dữ liệu). Mỗi đặc tính mảnh sau đó tham chiếu tới một mục nhập trong bảng dữ liệu tham chiếu.
– Sự bù của byte đầu tiên của đoạn trong các tập tin được chỉ định. Bù đắp này là đối với các byte đầu tiên của tập tin (byte 0) và trỏ trực tiếp đến các byte đầu tiên của dữ liệu dòng mã cho mảnh đó; nó không chỉ ra sự bắt đầu một hộp có chứa đoạn đó.
– Chiều dài của đoạn, theo byte.
Trong khi bù mảnh không trỏ đến sự bắt đầu của hộp, bất kỳ dữ liệu dòng mã nào chứa trong tập tin JPX phải được đóng gói trong hộp. Nếu dòng mã được chứa trong các tập tin JPX dưới hình thức tiếp giáp, sau đó nó sẽ được đóng gói trong một nộp dòng mã tiếp giáp theo quy định trong các định dạng tập tin JP2 và mục M.11.8; các tập tin sẽ không còn chứa một bảng mảnh đại diện cho rằng dòng mã tiếp giáp. Nếu dòng mã được chứa trong các tập tin JPX trong nhiều mảnh vỡ, sau đó dòng mã sẽ được đóng gói trong một hoặc nhiều phương tiện truyền thông dữ liệu hộp (định nghĩa trong M.11.9).
Hình M.1 cho thấy cách sử dụng bảng phân mảnh để xác định một dòng mã hoàn chỉnh trong một tập tin JPX ví dụ khi tất cả các mảnh vỡ được lưu trữ trong các tập tin riêng của mình. Bởi vì bảng dữ liệu tham chiếu là rỗng (không có tham chiếu bên ngoài), nó có thể không tồn tại trong tập tin JPX. Hộp khác hộp phân mảnh không được hiển thị một cách rõ ràng. Trong ví dụ này, dòng mã được chia thành bốn mảnh. Vạch tối phía dưới cùng của hộp truyền thông dữ liệu Hiển thị phần của nội dung đó hộp dữ liệu phương tiện truyền thông đại diện cho mảnh. Hai trong số những mảnh vỡ được chứa trong cùng một hộp truyền thông dữ liệu. Đối với mỗi đoạn, danh sách phân mảnh xác định sự bù đắp và chiều dài của mỗi mảnh. Các giá trị bù đắp trỏ đến các byte đầu tiên của dữ liệu dòng mã, tương ứng với sự khởi đầu của tập tin. Ví dụ, đoạn đầu tiên là lúc bắt đầu nội dung của một hộp dữ liệu phương tiện truyền thông. Bù đắp cho rằng mảnh là byte đầu tiên của nội dung của hộp, không phải để bắt đầu của tiêu đề hộp. Giá trị chiều dài xác định chiều dài duy nhất của dữ liệu dòng mã thực tế cho đoạn đó.
Hình M.1- Ví dụ phân mảnh tập tin JPX khi tất cả các mảnh trong cùng một tập tin
Để trích xuất dòng mã hoàn chỉnh từ các tập tin, một ứng dụng phải xác định vị trí các bảng phân mảnh bảng cho dòng mã trong tệp tin, sau đó phân tích độ bù lệch và độ dài từ danh sách phân mảnh. Các ứng dụng có thể sau đó chỉ đơn giản là tìm đến các địa điểm được chỉ định bởi các offsets và đọc số lượng dữ liệu được chỉ định bởi độ dài. Hình M.2 cho thấy cách sử dụng một bảng phân mảnh để xác định một dòng mã hoàn chỉnh trong một tập tin JPX ví dụ khi một số các mảnh vỡ được lưu trữ bên ngoài các tập tin. Trong trường hợp này, các tập tin sẽ chứa một hộp dữ liệu tham chiếu.
Hình M.2- Ví dụ phân mảnh tập tin JPX mà một số mảnh được lưu trữ trong các tập tin hoặc các nguồn
Trong ví dụ này, hai mảnh được lưu trữ trong các tệp tin riêng biệt nhưng các tệp tin được truy nhập vùng vị trí, và một trong những phân mảnh được lưu trên mạng.
M.5 Kết hợp nhiều dòng mã
Trong tệp tin JPX đơn giản nhất, một kết quả được cung cấp tạo ra bởi việc giải nén một dòng mã duy nhất tới một hoặc nhiều kênh ảnh và diễn giải chúng một cách hợp lý trong ngữ cảnh các đặc tả liên quan đến khoảng màu và đặc tả tùy chọn độ mờ. Chế độ này hoạt động giống nhau được cung cấp bởi JP2 ngoại trừ JPX cung cấp phạm vi các khoảng màu rộng hơn và các phương pháp đặc tả rộng hơn. Thêm vào đó, bù JPX cung cấp một tập hợp phong phú các phương pháp để kết hợp nhiều dòng mã nhằm tạo ra kết quả kết xuất.
Một tập tin JPX có thể lưu trữ nhiều loại “ảnh” JP2. Trong phạm vi một tập tin JPX duy nhất, những ảnh riêng biệt được gọi là lớp ghép. Mỗi lớp ghép này lại bao gồm một tập hợp các kênh mà ứng dụng cần xử lý như một đơn vị với mục đích kết xuất. Định dạng tập tin JPX bao gồm các cú pháp để xác định cách kết hợp các lớp ghép trong một tập tin bởi các ứng dụng trình đọc để tạo ra kết quả được kết xuất. Cả ảnh ghép và ảnh động đều được hỗ trợ.
Trong một tập tin JPX, lớp ghép là sự bổ sung để lưu trữ một ảnh duy nhất (hoặc trộn lớp) bằng cách sử dụng nhiều dòng mã. Điều này, ví dụ, cho phép sự chia tách thành phần RGB từ một thành phần kênh mờ. Điều này sẽ cho phép một kênh mờ duy nhất được tái sử dụng trong lớp ghép khác trong tập tin JPX. Các định dạng tập tin cũng bao gồm các cú pháp xác định cách các dòng mã kết hợp để tạo thành tập hợp bao gồm cách đăng ký không gian các dòng mã với nhau.
Trong một tập tin JPX, siêu dữ liệu có thể được liên kết với dòng mã và lớp ghép một cách độc lập. Siêu dữ liệu có thể được chia sẻ giữa nhiều dòng mã.
M.5.1. Ánh xạ dòng mã với các lớp ghép hợp
Để tạo thuận lợi cho việc lập bản đồ nhiều dòng mã cho các lớp ghép duy nhất, định dạng JPX tách trường tiêu đề định nghĩa cho JP2 thành hai nhóm hợp lý: những nhóm cụ thể cho một dòng mã duy nhất được nhóm lại thành một hộp tiêu đề dòng mã (M.11.6) và những nhóm cụ thể cho một lớp ghép được nhóm lại thành một hộp tiêu đề lớp ghép (M.11.7). Quá trình lập bản đồ các thành phần dòng mã cho kênh được minh họa trong hình M.3. Nhiều dòng mã được kết hợp thông qua một hộp đăng ký Dòng mã (M.11.7.7) để cung cấp thiết lập hoàn chỉnh các thành phần cho một lớp ghép. Một hộp bản đồ thành phần (ITU-T T.800 | ISO/IEC 15444-1, I.5.3.5) trong hộp tiêu đề dòng mã được sử dụng để xác định cách các thành phần dòng mã bất kỳ nhất định được ánh xạ tới kênh đó. Sự diễn giải của các kênh được quy định trong hộp tiêu đề lớp trộn hoặc bằng cách sử dụng một hộp định nghĩa kênh (M.11.7.5) hoặc một hộp Độ mờ (M.11.7.6). Hộp Độ mờ là một lựa chọn mới trong định dạng tập tin JPX mà cung cấp môt phương pháp bổ sung để chỉ định trộn lớp với cách ghép đơn giản hoặc sử dụng độ mờ khóa sắc độ.
Hình M.3 – Ví dụ sự kết hợp của hai dòng mã thành một lớp tổng hợp duy nhất
M.5.1.1 Thiết lập trật tự liên tục cho các lớp ghép hợp
Một trình tự để ghép lớp là cần thiết cho bất kỳ kiết xuất tiếp theo hoặc ảnh động của các tập tin. Trong trường hợp đơn giản nhất không có hộp đăng ký dòng mã trong các tập tin. Trong trường hợp này, bao gồm trường hợp tất cả các tiêu đề hiện nay là mặc định, bản đồ dòng mã trực tiếp cho việc ghép lớp và trình tự ghép lớp được đưa ra bởi bộ trình tự dòng mã trong các tập tin.
Nếu một hướng ngược đăng ký thành phần hiện diện trong bất kỳ hướng ngược tiêu đề lớp ghép hợp nào, thì sẽ có một hướng ngược tiêu đề lớp ghép đối với lớp ghép hợp trong tập tin, mỗi hướng ngược tiêu đề bao hàm ít nhất một hướng ngược đăng ký ghép hợp.. Trong trường hợp này, thứ tự các lớp ghép được cho bởi thứ tự liên tục các hướng ngược tiêu đề lớp ghép trong tập tin.
M.5.1.2 Thiết lập trật tự cho các kênh trong một lớp ghép hợp
Trong trường hợp kết hợp nhiều dòng mã cần thiết lập một trật tự thứ tự trên tập hợp các kênh được kết hợp được tạo ra từ chúng. Thứ tự này cần thiết để số kênh cụ thể được kết hợp với định nghĩa kênh khi sử dụng một hộp định nghĩa kênh.
Kênh thứ tự từ 0 và thực hiện một cách độc lập cho mỗi lớp ghép hiện tại trong các tập tin. N kênh đầu tiên (đánh số từ 0 đến đến n-1) trong phạm vi của một lớp ghép cụ thể được đóng góp bởi kênh được xác định bởi hộp tiêu đề dòng mã đầu tiên được tham chiếu trong hộp đăng ký thành phần của lớp (nơi chúng giả định dòng mã này tạo ra n kênh), m kênh tiếp theo của dòng mã tiếp theo được tham chiếu trong hộp đăng ký thành phần của lớp, và cứ như vậy. Trong mỗi dòng mã, thứ tự kênh được xác định theo lệnh của mục nhập trong hộp biểu đồ thành phần của dòng mã, hoặc theo lệnh của các thành phần trong dòng mã nếu không có hộp biểu đồ thành phần.
M.5.1.3 Thiết lập trật tự liên tục cho các dòng mã
Trật tự liên tục cho các dòng mã được yêu cầu đối với trật tự liên tục của các lớp ghép hợp và trong trường hợp đặc biệt nơi một hoặc nhiều hơn các lớp ghép hợp gồm có nhiều hơn một dòng mã.
các dòng mã được ấn định một trật tự liên tục bằng với vị trí của chúng trong tập tin, bắt đầu bằng 0. Trong trường hợp nơi sử dụng bảng phân mảnh, hướng ngược bảng phân mảnh được xem như tương đương với một hướng ngược dòng mã tiếp giáp với mục đích thiết lập trật tự liên tục dòng mã đối với dòng mã đã tham chiếu.
M.5.2. Chia sẻ thông tin tiêu đề và siêu dữ liệu giữa các dòng mã và lớp ghép hợp
Để giảm thiểu phí tổn tập tin, cho phép thông tin tiêu đề và siêu dữ liệu được chia sẻ giữa các dòng mã và lớp ghép nơi thông tin đó giống hệt nhau là hữu ích. Định dạng tập tin JPX cung cấp ba cơ chế chia sẻ thông tin: tiêu đề mặc định, tham chiếu chéo và Liên kết nhãn.
M.5.2.1 Các tiêu đề và siêu dữ liệu mặc định
Khi một hộp tiêu đề JP2 được tìm thấy trong tập tin JPX, thông tin tiêu đề trong hộp đó sẽ được sử dụng như thông tin tiêu đề mặc định toàn cầu cho tất cả các dòng mã và lớp ghép trong các tập tin. Nếu một hộp tiêu đề dòng mã bao gồm các hộp cũng xuất hiện trong hộp tiêu đề JP2, sau đó các tiêu đề này sẽ ghi đè lên các tiêu đề toàn cầu cho dòng mã cụ thể. Nếu một hộp tiêu đề dòng mã có chứa các hộp khác mà không xuất hiện trong hộp JP2 tiêu đề toàn cầu, thì các hộp sẽ làm tăng thêm thông tin tiêu đề toàn cầu cho dòng mã cụ thể. Tương tự, nếu một hộp tiêu đề lớp ghép bao gồm các hộp xuất hiện trong hộp tiêu đề JP2, nó sẽ ghi đè các tiêu đề toàn cầu cho lớp ghép cụ thể. Nếu một tiêu đề lớp ghép có chứa các hộp mà không xuất hiện trong hộp JP2 tiêu đề toàn cầu, các hộp sẽ làm tăng thêm các thông tin tiêu đề toàn cầu cho lớp ghép cụ thể.
Bất kỳ hộp siêu dữ liệu nào, bao gồm cả hộp Sở hữu trí tuệ, XML và UUID được xác định bởi đặc tính JP2 cũng như hộp siêu dữ liệu bổ sung được xác định bởi đặc tả này, tìm thấy ở cấp độ tập tin (không chứa trong bất kỳ superbox khác) cũng sẽ được coi là có chứa thông tin mặc định toàn cầu. Như với hộp tiêu đề, các giá trị mặc định toàn cầu có thể được ghi đè hoặc bổ sung trên một một dòng mã hoặc một lớp cơ sở lớp ghép bởi sự bao gồm của hộp tương ứng ở dòng mã hoặc lớp tiêu đề superboxes.
M.5.2.2 Các tiêu đề và siêu dữ liệu tham chiếu chéo
Một hộp tiêu đề dòng mã hoặc hộp lớp ghép cũng có thể chứa tham chiếu chéo tới một hộp được lưu trữ trong vị trí khác. Tham chiếu chéo này tương tự như hộp bảng phân mảnh được sử dụng để xác định vị trí của một dòng mã phân mảnh. Trong thực tế, một hộp tham chiếu chéo sử dụng cấu trúc dữ liệu tương tự như hộp bảng phân mảnh, với việc bổ sung một trường xác định loại hộp được tham chiếu. Nếu hộp tiêu đề dòng mã hoặc hộp tiêu đề lớp ghép có chứa hộp tham chiếu chéo, bộ đọc sẽ xem xét hộp được trỏ tới bởi tham chiếu chứa tiêu đề. Hộp tham chiếu có thể được sử dụng như nhau cho tiêu đề và siêu dữ liệu.
M.5.2.3 Nhãn và liên kết
Hộp liên kết có thể được sử dụng để chia sẻ một nhãn (hoặc siêu dữ liệu) giữa các dòng mã và các lớp ghép bởi nó có một hộp danh sách số lượng trong hộp Liên kết. Một hộp danh sách số lượng liên quan, bởi số lượng, tới một tập hợp các thực thể trong tập tin. Nếu hộp đầu tiên trong hộp Liên kết là hộp danh sách số, thì các hộp khác bất kỳ trong hộp Liên kết sẽ được liên kết với tất cả các thực thể được tham chiếu bởi hộp danh sách số.
M.5.3. Ghép hợp
Dữ liệu thành phần được chia thành các tùy chọn cố định, có trong hộp tùy chọn thành phần (M.11.10.1), và một chuỗi các hướng dẫn bên trong một hoặc nhiều hộp Hộp thiết lập hướng dẫn (M.11.10.2). Mỗi hướng dẫn này bao gồm một tập hợp các thông số kết xuất. Mỗi liên kết hướng dẫn có một số lần lặp lại cho phép cách trình bày hiệu quả chuỗi dài của các hướng dẫn lặp đi lặp lại như xảy ra trong chuỗi chuyển động hoặc trong các trình chiếu sử dụng một ảnh động chuyển tiếp hướng ngược lặp đi lặp lại. Một bộ đọc tập tin JPX sẽ hiển thị một tập tin JPX bằng cách đọc và thực hiện các hướng dẫn theo thứ tự, từ mỗi thiết lập hướng dẫn theo thứ tự và lặp đi lặp lại theo giá trị lặp lại của nó. Các tập tin được coi là kết xuất đầy đủ hoặc khi không có hướng dẫn chi tiết để thực hiện, hoặc không có lớp ghép cho các hướng dẫn hiện hành.
M.5.3.1. Ghép kết xuất
Dữ liệu ghép xác định chiều rộng và chiều cao của một vùng kết xuất thành các lớp ghép đã được kết xuất. Kích cỡ của vùng kết xuất là kích cỡ của kết quả đã kết xuất và có thể xem như kích thước ảnh tổng thể. Các tham số trong mỗi chỉ lệnh kết xuất có thể đặc tả:
– Một vùng hình chữ nhật để cắt từ lớp ghép nguồn;
– Định vị góc trái phía trên của các lớp ghép (có khả năng cắt) ghép có liên quan tới góc trái bên trên của vùng kết xuất;
– Chiều rộng và chiều cao của khu vực trong vùng kết xuất thành lớp ghép (có khả năng cắt) được kết xuất.
– Ví dụ, trong một ảnh thành phần sử dụng một khoảng màu RGBA cho tất cả các lớp ghép, lớp ghép hiện tại (Rt, Gt, Bt, At) là kết xuất lý tưởng trên nền (Rb, Gb, Bb, Ab) để tạo thành ảnh được xuất ra (Rc, Gc, Be, Ac) theo phương trình sau:
Trong trường hợp mẫu dưới là mờ hoàn toàn, điều này được đơn giản hóa thành:
Tuy nhiên, các phương trình ở trên yêu cầu quyền truy cập vào các điểm ảnh nền, và cho một loạt lý do, ứng dụng riêng lẻ có thể không sẵn sàng hoặc có khả năng hỗ trợ như một quá trình tái tạo. Nó có thể mô phỏng pha trộn liên tục ngay cả trong những trường hợp này bởi ngưỡng hoặc phối màu các kênh được cung cấp để tạo ra một tập hợp các điểm ảnh hoàn toàn minh bạch hoặc hoàn toàn mờ mà có thể được kết xuất bằng cách sử dụng thay thế đơn giản điểm ảnh trên một nền tảng không rõ. Tuy nhiên đặc tính của phương pháp này nằm ngoài phạm vi của Tiêu chuẩn này.
M.5.3.2 Mô hình ảnh động
Ngoài việc cắt xén và định vị các thông số cơ bản, mỗi hướng dẫn vẽ có thể bao gồm các thông số LNÉUE, PERSIST và NEXT-USE. Tham số LNÉUE gán một khoảng thời gian tạm thời để hướng dẫn. Đây là khoảng thời gian mà bộ đọc nên định hướng để đặt giữa sự xuất hiện của bất kỳ bản cập nhật màn hình dẫn tới từ việc thực thi các hướng dẫn hiện hành và cập nhật bất kỳ màn hình dẫn tới từ việc thực hiện của lệnh tiếp theo. PERSIST là một trường nhị phân thể hiện có hay không lớp ghép được đưa ra bởi các hướng dẫn hiện hành phải được coi là một phần của nền tảng cho các lệnh tiếp theo. Nếu một quy định cụ thể hướng dẫn sai cho PERSIST, thì bộ đọc phải lưu nền trước khi thực hiện và sử dụng nền tảng lưu này khi thực hiện lệnh tiếp theo..
M.5.3.2.1 Các trường hợp đặc biệt của vòng đời và tồn lưu
Có một số tổ hợp đặc biệt của các tham số LNẾUE và PERSIST cần điều trị cụ thể của bộ đọc.
– Khi PERSIST là sai và LNẾUE bằng không, không có hành động nào được thực hiện bởi bộ đọc. Tổ hợp này có thể được sử dụng cho ví dụ để buộc một đầu đọc bước qua một ảnh thu nhỏ hoặc in hướng ngược hình sẽ được hiển thị bằng một đầu đọc không có khả năng hiển thị các tập tin kiểu như một ảnh động.
– Khi PERSIST là đúng và LNẾUE bằng không thì chỉ lệnh này được thực hiện cùng với các chỉ lệnh tiếp theo. Trong thực tế, sự kết hợp này có thể xảy ra cho một chuỗi nhiều hơn hai chỉ lệnh và sẽ đặt bộ đọc vào một chế độ ghép khung. Chế độ này được thoát ra khi một lệnh có PERSIST khác không hoặc khi kết thúc các ảnh động đã đạt được. Tập hợp các chỉ lệnh thực hiện trong khi ở chế độ ghép hướng ngược được gọi là một chuỗi ghép hợp khung. Trong chế độ ghép khung, một lớp ghép ảo được tạo ra (off-screen) bằng cách thực hiện các chỉ lệnh trong chuỗi định nghĩa khung. Các tham số PERSIST và LNẾUE cho các lệnh đóng của một định nghĩa hướng ngược được áp dụng cho toàn bộ lớp ghép ảo. Đó là chế độ ghép hướng ngược đóng phía trên, tất cả các lớp ghép được đưa vào chuỗi ghép hướng ngược đạt được các giá trị PERSIT và LNẾUE của hướng ngược đống trong chuỗi.
– Khi LNẾUE đạt giá trị tối đa có thể được lưu trữ các thiết bị đọc sẽ giải thích điều này như là một yêu cầu cho tồn tại vô thời hạn. Nếu ứng dụng khởi động có khả năng, nó sẽ tiến đến hướng dẫn tiếp theo sau khi hoàn thành một số tương tác người dùng được xác định trước như một cú click chuột. Ngoài việc sử dụng của nó trong phim hoạt hình, tính năng này có thể được sử dụng trong các tập tin lưu trữ tài liệu nhiều trang để buộc bộ đọc phải dừng lại sau cấu thành của mỗi trang.
Nói chung, cập nhật màn hình sẽ không được thực hiện sau một lệnh trong đó có LNẾUE bằng 0 trừ khi nó là hướng dẫn cuối cùng trong một chuỗi thành phần khung.
M.5.3.2.2 Phân định các lớp tổng hợp với các tập lệnh và tái sử dụng lớp
Nén của chuỗi phim hoạt hình được cải thiện đáng kể nếu lớp ghép có thể được tái sử dụng trong nhiều hướng ngược hình. Đồng thời nó mong muốn rằng các hướng dẫn tham khảo lớp ghép đó đã được giải mã hoặc là tuần tự tiếp theo trong tập tin. Hơn nữa, bộ giải mã tốt hơn có thể tối ưu hóa bộ nhớ đệm của các lớp ghép lại nếu họ có thể cho biết lớp sẽ được tái sử dụng trước thời hạn. Các chính sách này được thực thi trong JPX thông qua nguyên tắc sử dụng liên kết các lớp ghép với các hướng dẫn.
Hướng dẫn đầu tiên luôn gắn liền với các lớp ghép đầu tiên trong tập tin, Hướng dẫn này có thể chỉ định một giá trị cho NEXT-USE. Giá trị này được hiểu là số lượng hướng dẫn, bao gồm các hướng dẫn hiện tại, cho đến khi lớp ghép hiện tại được tái sử dụng. Một giá trị của không chỉ ra cho bộ đọc rằng các lớp ghép hiện tại sẽ không được sử dụng một lần nữa và có thể bị lãng quên. Một giá trị có hàm ý rằng các lớp ghép hiện nay là được sử dụng với các lệnh tiếp theo và cứ như vậy. Bộ đọc phải duy trì ghi lại các hướng dẫn đã được phân lớp ghép trong phần này. Bất cứ khi nào một lệnh không được gán lớp ghép, các lớp ghép không sử dụng tiếp theo được xác định trong tập tin sẽ sử dụng; việc sử dụng NEXT-USE không xác định một vòng lặp. Một lớp ghép duy nhất có thể được tái sử dụng nhiều lần trong bất kỳ ảnh nào.
M.5.3.2.3 Lặp lại các ảnh động
Nó có thể chỉ định một ảnh động nên được lặp lại. Đó là, khi các ảnh động đã được kết xuất đầy đủ, bộ đọc reset màn hình hiển thị trạng thái ban đầu của nó và hiển thị các ảnh động trên một lần nữa. Một số vòng lặp là tùy chọn xác định như một phần của các tùy chọn thành phần, Như với trường LNẾUE, giá trị tối đa cho các tham số vòng lặp được sử dụng để xác định sự lặp vô thời hạn. Looping tác động tới bộ nhớ đệm được sử dụng bởi bộ đọc như nhiều bộ đọc sẽ không muốn bất kỳ lớp ghép nào rảnh rỗi một khi được giải mã.
M.6 Sử dụng các yêu cầu kết xuất che giấu để xác định cách sử dụng một tập tin
Định dạng JPX định nghĩa một kiến trúc tập tin chứ không phải là một tập hợp cụ thể, cố định các cấu trúc dữ liệu sẽ được tìm thấy trong một tập tin. Kiến trúc này là phức tạp, đủ để cho phép cấu trúc tập tin khá khác biệt. Ví dụ, một tập tin JPX có thể bao gồm:
– Ảnh động;
– Tập hợp ảnh;
– Bộ ảnh dự phòng (ví dụ như, in và hiển thị các phiên bản của cùng một cảnh); hoặc Ảnh đơn trong khoảng màu sắc đặc biệt (ví dụ như, tham số CIELab).
Kết quả là, các nhãn JPX báo cho bộ đọc một chút về những gì khả năng nó sẽ đòi hỏi một cách chính xác để đọc một tập tin JPX tùy ý. Thay vào đó, JPX truyền tải thông tin này bằng cách sử dụng ba biểu thức chứa với trong tiêu đề của tập tin. Những biểu thức mô tả:
1) tập hợp đầy đủ công nghệ/tính năng hiện diện trong các tập tin;
2) tập hợp các công nghệ/tính năng theo yêu cầu của một bộ giải mã để đọc các tập tin trong một hình thức phù hợp với mục đích của tác giả tập tin;
3) một chế độ dự phòng có thể được sử dụng để hiển thị một kết quả tối thiểu chấp nhận được (thường là một hình nhỏ hoặc xem trước).
Chế độ dự phòng được truyền bằng cách sử dụng hộp loại tệp tin và chủ yếu được thiết kế để chỉ ra cho dù có hay không các tập tin có thể được đọc bởi một bộ đọc với các khả năng tiêu chuẩn cụ thể (chẳng hạn như một JP2 phù hợp hoặc bộ đọc JPX cơ bản). Tuy nhiên, sự kết hợp của các công nghệ cần thiết có thể quá phức tạp đối với một danh sách các chức năng đơn giản trong các tập tin. Vì lý do này, các thông tin thiết lập công nghệ/tính năng có dạng của biểu thức logic được mã hóa và được chứa trong một hộp đọc yêu cầu.
Nói chung, một bộ đọc chỉ cần xác định rằng nó đáp ứng các yêu cầu được nêu trong điểm 2 để đảm bảo đọc đủ tập tin để thực hiện ý định của tác giả. Mặt khác, một trình soạn thảo có thể thông báo cho người dùng nếu có bất kỳ khía cạnh của các tập tin mà nó không biết làm thế nào để hỗ trợ. Bởi vì tất cả các tập tin họ JPEG 2000 không nhất thiết phải tương thích với tất cả các bộ đọc JPX, những biểu thức mô tả từng khía cạnh của các tập tin, và sự kết hợp của tính năng phải được hỗ trợ để giải thích các tập tin một cách chính xác.
M.6.1 Các dạng biểu thức
M.6.1.1. Về mặt nhận thức đầy đủ
Một biểu thức mã hóa được sử dụng để mô tả tất cả các mục chứa trong các tập tin, và kết hợp các chức năng cần thiết để đọc những mục này. Biểu thức này mô tả mỗi tùy chọn chính bộ đọc có thể xử lý các tính năng của các tập tin, bất kể việc cần hỗ trợ một tính năng cụ thể cho việc sử dụng khía cạnh đó của các tập tin. Ví dụ, một tệp có thể chứa các siêu dữ liệu mô tả một tập tin gốc mà từ đó nó được tạo ra; Tuy nhiên, một bộ đọc không cần thiết hiểu siêu dữ liệu này để sử dụng một cách chính xác các tập tin.
M.6.1.2 Các nội dung hiển thị
Một biểu thức thứ hai được sử dụng để mô tả các chức năng cần thiết hiển thị nội dung của tập tin như mong muốn. Tập tin có thể chứa một số đại diện của một ảnh duy nhất, do đó sự biểu thức hiển thị các nội dung chính xác có thể bao gồm một số tùy chọn.
M.6.1.3 Dự trữ
Trong trường hợp một tập tin không thể được hiển thị như mong muốn của các bộ ghi, một phương pháp dự phòng cho hiển thị các tập tin được xác định. Các phương pháp dự phòng nhằm mục đích cuối cùng là khả năng tương thích, như vậy, chúng có thể không tạo ra chính xác đầu ra mong muốn.
Một danh sách các phương pháp dự phòng được lưu trữ trong hộp loại tập tin tại đầu tập tin họ JPEG 2000: tất cả các file mà bắt đầu với một hộp chữ ký JPEG 2000 phải chứa một hộp loại tập tin. Hộp Loại tập tin chứa một danh sách các phương pháp đọc tập tin được biết đến. Ví dụ, định dạng tập tin JP2 xác định vị trí dự phòng JP2. Điều này chỉ định một bộ đọc phù hợp với đặc điểm định dạng tệp của JP2, như định nghĩa trong ITU-T T.800 | Tiêu chuẩn ISO/IEC 15444-1, I.2.6, có thể đọc các tập tin.
Phương pháp dự phòng được lưu trữ trong hộp Loại tập tin. Thứ tự trong hộp là không có ý nghĩa. Khi một đầu đọc hỗ trợ nhiều hơn một phương pháp dự phòng được mô tả trong các tập tin, bộ đọc xác định phương pháp dự phòng để sử dụng.
M.6.2 Biểu diễn biểu thức
Việc yêu cầu biểu thức để hiểu đầy đủ tất cả các khía cạnh, và để hiển thị các tập tin như mong muốn được lưu trữ trong hộp yêu cầu bộ đọc, đó là một tính năng bắt buộc của một định dạng tập tin JPX. Nếu hộp yêu cầu bộ đọc không hiện hữu, hộp loại tập tin mô tả các chức năng đầy đủ của tập tin.
Những biểu thức yêu cầu đọc là biểu thức logic liên quan đến chức năng được cung cấp bởi các bộ ghi. Những biểu thức bao gồm tùy chọn dành riêng cho người cung cấp. Biểu thức được tính vào các biểu thức con tách biệt VÀ, chỉ HOẶC hoạt động. Sau đó được mã hóa vào các mặt nạ bít mà bộ đọc có thể sử dụng để xác định cách xử các tập tin.
Hộp yêu cầu bộ đọc bao gồm hai biểu thức, biểu thức hiểu đầy đủ các khía cạnh, và biểu thức nội dung hiển thị. Nói chung, những biểu thức sẽ chia sẻ một số biểu thức con; biểu thức con được chia sẻ chỉ được lưu trữ một lần, và các mặt nạ bít được sử dụng để xác định những biểu thức con thuộc về mỗi biểu thức.
M.6.2.1 Tính toán các biểu thức yêu cầu
Khi xây dựng các biểu thức yêu cầu mô tả một tập tin, mỗi biểu thức được tính vào lần đầu trong các biểu thức con tách biệt VÀ, mỗi biểu thức con chứa các lựa chọn tách biệt HOẶC. Do đó, một biểu thức có dạng:
(A & B & C & E) | (D & E) (M-3)
Được tính vào trong biểu thức:
(A | D) & (B | D) & (C | D) & E (M-4)
Mỗi biểu thức con được thể hiện như một ma trận bit, với một lá cờ đặt cho mỗi tùy chọn xuất hiện trong biểu thức con đó. Vì vậy, ví dụ, biểu thức (A | D) trở thành:
Bảng M.1. Biểu thức mẫu
A |
B |
C |
D |
E |
1 |
0 |
0 |
1 |
0 |
Biểu thức đầy đủ được viết trong bảng sau:
Bảng M.2: Biểu thức mở rộng
A | D |
B | D |
C | D |
E |
|
1 |
0 |
0 |
0 |
A |
0 |
1 |
0 |
0 |
B |
0 |
0 |
1 |
0 |
C |
1 |
1 |
1 |
0 |
D |
0 |
0 |
0 |
1 |
E |
với mỗi biểu thức con trong một cột của bảng. Vì vậy, để đáp ứng các yêu cầu của biểu thức này, một bộ đọc được hỗ trợ một trong các chức năng trong mỗi cột của bảng.
Tuy nhiên, có hai biểu thức được mã hóa, và chúng sẽ, nói chung, chia sẻ yếu tố chung (bởi vì các chức năng cần thiết để hiển thị một tập tin là một phần chức năng cần thiết để hiểu nội dung của nó một cách đầy đủ). Vì vậy, hai biểu thức được kết hợp thành một bảng, và một mặt nạ bit được cung cấp để xác định những cột trong bảng thuộc về mỗi biểu thức. Vì vậy, nếu các biểu thức trong phương trình M-3 nội dung hiển thị và nếu biểu thức cho các khía cạnh hiểu đầy đủ là:
((A | D) & (B | D) & (C | D) & E) & (F | G) (M-5)
sau đó, lưu ý rằng các biểu thức trong phương trình M-4 là một yếu tố chung, ở đây, bảng kết quả là:
Bảng M.3 – Ví dụ biểu hiện yếu tố
1 |
0 |
0 |
0 |
0 |
A |
0 |
1 |
0 |
0 |
0 |
B |
0 |
0 |
1 |
0 |
0 |
C |
1 |
1 |
1 |
0 |
0 |
D |
0 |
0 |
0 |
1 |
0 |
E |
0 |
0 |
0 |
0 |
1 |
F |
0 |
0 |
0 |
0 |
1 |
G |
1 |
1 |
1 |
1 |
0 |
Nội dung hiển thị |
1 |
1 |
1 |
1 |
1 |
Hiểu đầy đủ |
Trong khi đầu tiên bốn cột là yêu cầu nội dung Hiển thị, và tất cả năm biểu thức con được yêu cầu là khía cạnh hiểu đầy đủ. Vì thế mặt nạ bit hiển thị nội dung là 11110, và mặt nạ bit cho là khía cạnh hiểu đầy đủ là 11111.
Bảng này có thể được đọc trong các cột, như một tập hợp các biểu thức con xác định chức năng được yêu cầu của một trình đọc, hoặc trong hàng, như một tập hợp các mặt nạ bit tương thích mà một bộ đọc có thể sử dụng để xác định liệu nó có thể đọc các tập tin. Bằng cách lấy bitwise HOẶC hàng tương ứng với các chức năng hiện tại, và so sánh kết quả với các mặt nạ bit cho hai biểu thức, một bộ có thể xác định xem nó có thể đáp ứng các từng yêu cầu.
Do đó, một bộ ghi có thể xây dựng bảng trong cột, thiết lập lá cờ tương ứng với các tùy chọn trong mỗi biểu thức con, và tạo ra các mặt nạ bit mô tả mà biểu thức con là VÀ ed với nhau để tạo thành những biểu thức đầy đủ cho Fully Underst VÀ Aspect, và Display Contents. Sau đó, nó có thể tương thích mặt nạ bit cho mỗi chức năng mà bộ đọc sử dụng trong việc đọc tập tin, bằng cách chiết xuất hàng tương ứng với mỗi chức năng hiện nay.
M.6.2.2 Mã hóa các biểu thức yêu cầu
Các biểu thức yêu cầu được mã hóa trong hướng ngược yêu cầu kết xuất, bắt đầu bằng độ dài che giấu, chỉ thị độ rộng của các bít che giấu tương thích với byte quyết định. Điều này cho phép bởi bít che giấu để nhận thức đầy đủ và hiển thị nội dung biểu thức, liệt kê các tính năng được sử dụng và che giấu tính tương thích thu được từ các hàng của bảng biểu thức.
Danh mục liệt kê bao gồm một tập các tính năng chuẩn được sử dụng (như đặc tả trong Bảng M.14) và các bít che giấu tương thích, cho phép bởi danh mục các tính năng đặc tả cung cấp (thể hiện như UUIDs) cùng với các bít che giấu tương thích. Ngoài sự phân chia thành các tính năng chuẩn và đặc tả cung cấp ra, trật tự của biểu diễn là không quan trọng, cấu trúc này được đặc tả đầy đủ trong M.11.1.
M.6.2.3 Các ví dụ
Ví dụ, hãy xem xét một chương trình xử lý ảnh mà tạo ra tập tin JPX có chứa một ảnh duy nhất trong khoảng màu sRGB, và một phiên bản nhiều dòng mã có các lớp ghép, để cho phép một trình soạn thảo làm việc với ảnh, và bao gồm các siêu dữ liệu có chứa lịch sử của các tập tin, sau đó yêu cầu hiển thị các tập tin ảnh:
sRGB & (single codestream | (multiplecodestream& compositing)) (M-6)
Và để hiểu đầy đủ các yêu cầu của tập tin:
sRGB & (single codestream | (multiplecodestream & compositing)) & metadata (M-7)
Phương trình M-6 thành:
sRGB & (single codestream | multiple codestream) & (single codestream | compositing) (M-8)
Các yếu tố tương tự Phương trình M-7, do đó, những biểu thức con là:
a) sRGB;
b) dòng mã duy nhất | nhiều dòng mã;
c) dòng mã duy nhất | ghép;
d) siêu dữ liệu.
Kết quả bảng biểu thức và các mặt nạ bít được thể hiện trong bảng M.4. Các mặt nạ bít chỉ ra những biểu thức phụ được yêu cầu cho mỗi mức độ chức năng. Do đó các biểu thức cho Nội dung hiển thị là:
(Sub-expr a) & (Sub-expr b) & (Sub-expr d) (M-9)
Bảng M.4 – Ví dụ về một biểu thức yêu cầu bộ đọc cho phương trình M-6 và M-7
Biểu thức con a |
Biểu thức con b |
Biểu thức con c |
Biểu thức con d |
|
sRGB |
1 |
0 |
0 |
0 |
Dòng mã duy nhất |
0 |
1 |
1 |
0 |
Nhiều dòng mã |
0 |
1 |
0 |
0 |
Ghép |
0 |
0 |
1 |
0 |
Siêu dữ liệu |
0 |
0 |
0 |
1 |
Mặt nạ bít Đầy đủ và các khía cạnh |
1 |
1 |
1 |
1 |
Mặt nạ bít Nội dung hiển thị |
1 |
1 |
1 |
0 |
Vì vậy, bảng trên được lưu trữ trong tập tin như thể hiện trong bảng M.5:
Bảng M.5 – Ví dụ về một hộp các yêu cầu bộ đọc cho phương trình M-6 và M-7
Chiều dài mặt nạ (tính bằng bytes) | 1a) | ||||||||
Mặt nạ bít Đầy đủ và các khía cạnh |
1 |
1 |
1 |
1 |
|
||||
Mặt nạ bit Nội dung hiển thị |
1 |
1 |
1 |
0 |
|
||||
Số chức năng cơ bản | 5 | ||||||||
Danh sách tương thích tính năng tiêu chuẩn | sRGB | ||||||||
1 |
0 |
0 |
0 |
|
|||||
Dòng mã duy nhất | |||||||||
0 |
1 |
1 |
0 |
|
|||||
Nhiều dòng mã | |||||||||
0 |
1 |
0 |
0 |
|
|||||
ghép | |||||||||
0 |
0 |
1 |
0 |
|
|||||
Siêu dữ liệu | |||||||||
0 |
0 |
0 |
1 |
|
|||||
Số tính năng cụ thể Nhà cung cấp | 0 | ||||||||
1 byte, vì mặt nạ rộng 4 bít, phù hợp với 1 byte. | |||||||||
Như là một ví dụ thứ hai, cho rằng các trình điều khiển máy in ACME tạo một tập tin JPX có chứa một ảnh sRGB dòng mã duy nhất, để hiển thị, và một ảnh CMYK, có thể được đọc bởi một trình điều khiển máy in bằng cách sử dụng các chức năng cụ thể của nhà cung cấp ACME. Với Tập tin này, biểu thức cho Fully Nội dung hiển thị là:
(sRGB & single codestream) | (CMYK & single codestream & ACME extensions) (M-10)
Trong đó biểu thức Underst VÀ All Aspects là:
((sRGB& single codestrean) | (CMYK & single codestream& ACME extensions)) & metadata& ACME print metadata (M-11)
Phân tích thành biểu thức con:
single codestream & (sRGB | CMYK) & (sRGB | ACME extensions) (M-12)
và:
single codestream & (sRGB | CMYK) & (sRGB | ACME extensions) & metadata & ACME print metadata (M-13)
tương ứng.
Các tập tin kết quả bảng các yêu cầu bộ đọc được thể hiện trong bảng M.6:
Table M.6 – Bảng yêu cầu bộ đọc đối với phương trình M-10 và M-11
sRGB |
0 |
1 |
0 |
1 |
0 |
CMYK |
0 |
1 |
0 |
0 |
0 |
Dòng mã duy nhất |
1 |
0 |
0 |
0 |
0 |
Siêu dữ liệu |
0 |
0 |
1 |
0 |
0 |
Phần mở rộng ACME |
0 |
0 |
0 |
1 |
0 |
ACME in siêu dữ liệu |
0 |
0 |
0 |
0 |
1 |
Mặt nạ bit Đầy đủ và các khía cạnh |
1 |
1 |
1 |
1 |
1 |
Mặt nạ bit Nội dung hiển thị |
1 |
1 |
0 |
1 |
0 |
Như thường lệ, mỗi cột đại diện cho một yếu tố biểu thức con, và mỗi hàng cung cấp một khả năng tương thích mặt nạ bit mà một bộ đọc có thể sử dụng để xác định liệu nó có thể đọc các tập tin. Ví dụ này bao gồm các tính năng cụ thể nhà cung cấp, và rằng biểu thức con có thể liên quan đến cả tiêu chuẩn và chức năng cụ thể nhà cung cấp. Chúng được lưu trữ trong các tập tin như thể hiện trong bảng M.7:
Bảng M.7 – Yêu cầu bộ đọc hướng ngược giữ liệu đối với phương trình M-10 và M-11
Chiều dài mặt nạ (tính bằng bytes) | 1 | ||||||||||
Mặt nạ bit Đầy đủ và các khía cạnh |
1 |
1 |
1 |
1 |
1 |
|
|||||
Mặt nạ bit Nội dung hiển thị |
1 |
1 |
0 |
1 |
0 |
|
|||||
Số chức năng cơ bản | 4 | ||||||||||
Danh sách tương thích tính năng tiêu chuẩn | sRGB | ||||||||||
0 |
1 |
0 |
1 |
0 |
|
||||||
CMYK | |||||||||||
0 |
1 |
0 |
0 |
0 |
|
||||||
Dòng mã duy nhất | |||||||||||
1 |
0 |
0 |
0 |
0 |
|
||||||
Siêu dữ liệu | |||||||||||
0 |
0 |
1 |
0 |
0 |
|||||||
Số tính năng cụ thể Nhà cung cấp | 2 | ||||||||||
Danh sách tính năng tương thích nhà cung cấp | mở rộng UUID cho ACME | ||||||||||
0 |
0 |
0 |
1 |
0 |
|
||||||
Siêu dữ liệu in UUID cho ACME | |||||||||||
0 |
0 |
0 |
0 |
1 |
|||||||
Xem xét một tập tin JPX có chứa hai lớp ghép không được kết hợp ảnh động hoặc ghép: chúng là các kết quả được kết xuất riêng biệt hai khái niệm. Lớp ghép đầu tiên có chứa một dòng mã duy nhất trong khoảng màu sRGB (quy định sử dụng phương pháp Enumerated). Lớp ghép thứ hai chứa một dòng mã duy nhất, mà khoảng màu được chỉ định bằng cách sử dụng phương pháp ICC Bất kỳ. Ngoài ra, lớp ghép thứ hai chứa các siêu dữ liệu nhà cung cấp cụ thể. Đối với tập tin này, biểu thức Fully Nội dung hiển thị là:
(sRGB & single codestream) | (full ICC & single codestream & ACME extensions) (M-14)
Trong đó biểu thức cho Underst VÀ All Aspects là:
((sRGB & single codestream) | (full ICC & sRGB & single codestream & ACME extensions)) (M-15)
Phân tích thành biểu thức con:
single codestream AND (sRGB | full ICC) AND (sRGB | ACME extensions) (M-16)
và:
single codestream AND sRGB AND full ICC AND ACME extensions (M-17)
tương ứng.
Các tập tin kết quả bảng các yêu cầu bộ đọc được thể hiện trong bảng M.8:
Bảng M.8 – Yêu cầu bộ đọc hướng ngược dữ liệu đối với phương trình M-16 và M-17
Chiều dài mặt nạ (tính bằng bytes) | 1 | ||||||
Mặt nạ bit Đầy đủ và các khía cạnh |
1 |
0 |
0 |
1 |
1 |
1 |
|
Mặt nạ bit Nội dung hiển thị |
1 |
1 |
1 |
0 |
0 |
0 |
|
Số chức năng cơ bản | 3 | ||||||
Danh sách tương thích tính năng tiêu chuẩn | sRGB | ||||||
0 |
1 |
1 |
1 |
0 |
0 |
|
|
Bất kỳ ICC | |||||||
0 |
1 |
0 |
0 |
1 |
0 |
|
|
Dòng mã duy nhất | |||||||
1 |
0 |
0 |
0 |
0 |
0 |
|
|
Số tính năng cụ thể Nhà cung cấp | 1 | ||||||
Danh sách tính năng tương thích nhà cung cấp | phần mở rộng UUID của ACME | ||||||
0 |
0 |
0 |
1 |
0 |
|
|
M.6.3. Kiểm soát thực hiện dựa vào các biểu thức yêu cầu
Để xác định liệu nó có thể đọc các tập tin, bộ đọc chiết xuất khả năng tương thích mặt nạ bit từ mục nhập danh sách tính năng tương ứng với mỗi chức năng mà nó cung cấp. Nếu một lá cờ được đặt trong mặt nạ bit, thì chức năng này là một lựa chọn trong biểu thức con tương ứng với cờ.
Vì vậy, nếu bộ đọc thực hiện một bitwise HOẶC của mặt nạ bit cho tất cả các chức năng mà nó cung cấp, nó có thể xác định xem nó có thể đọc các tập tin bằng cách so sánh kết quả với các mặt nạ bit Đầy đủ và các khía cạnh VÀ Nội dung hiển thị từ các tập tin. Ngoài ra, bằng cách phục dựng lại các bảng biểu thức và nhìn lên cột (hoặc các cột) của bảng nơi cờ mặt nạ bit tập tin được thiết lập, và khả năng tương thích cờ mặt nạ bit của bộ đọc không có, bộ đọc có thể xác định thêm chức năng cần thiết để đọc các tập tin.
Nếu có chức năng được cung cấp bởi bộ đọc, mà không nằm trong danh sách tính năng cho các tập tin, thì các tính năng không cần thiết phải đọc các tập tin (và mặt nạ bit có thể được giả định là tất cả bằng 0).
Xem xét hộp các yêu cầu bộ đọc đầu tiên ví dụ:
Bảng M.9 – Ví dụ hướng ngược yêu cầu bộ đọc để kiểm tra
Chiều dài mặt nạ (tính bằng bytes) | 1 | ||||
Mặt nạ bit Đầy đủ và các khía cạnh |
1 |
1 |
1 |
1 |
|
Mặt nạ bit Nội dung hiển thị |
1 |
1 |
1 |
0 |
|
Số chức năng cơ bản | 5 | ||||
Danh sách tương thích tính năng tiêu chuẩn | sRGB | ||||
1 |
0 |
0 |
0 |
|
|
dòng mã đơn | |||||
0 |
1 |
1 |
0 |
|
|
Siêu dòng mã | |||||
0 |
1 |
0 |
0 |
|
|
hợp lại | |||||
0 |
0 |
1 |
0 |
|
|
siêu dữ liệu | |||||
0 |
0 |
0 |
1 |
|
|
Số tính năng cụ thể Nhà cung cấp | 0 |
Trong ví dụ này, nếu bộ đọc hỗ trợ chức năng sRGB và dòng mã, nó nhìn lên các mặt nạ bít cho các tính năng (1000 và 0110, tương ứng). Bitwise HOẶC cho khả năng tương thích mặt nạ của tập tin này cho bộ đọc, 1110. Vì vậy bộ đọc này hoàn toàn có thể hiển thị nội dung của các tập tin; Tuy nhiên, nó sẽ không hiểu tất cả các khía cạnh của các tập tin.
Chú ý rằng khả năng tương thích mặt nạ cho bộ đọc (DCM) là 1110, và mặt nạ Đầy đủ và các khía cạnh (FUAM) là 1111, người đọc có thể thực hiện (FUAM & IDCM) bitwise, để có được 0001. Điều này cho nó biết rằng thiếu chức năng bitmask cho bộ 4 bit, do đó, nó có thể tìm kiếm danh sách này, và xác định rằng các chức năng thiếu hỗ trợ siêu dữ liệu.
M.7 Mở rộng với định dạng tập tin JPX và đăng ký các phần mở rộng
Đăng ký là quá trình thêm tiện ích mở rộng cho năng lực của đặc tính sau khi đặc tính được công bố. Trong khuyến nghị | Tiêu chuẩn quốc tế này, nhiều khả năng có thể được gia hạn thông qua đăng ký. Các mục khác có thể được mở rộng, nhưng không đòi hỏi sự can thiệp của một bên thứ ba để ngăn chặn xung đột phần mở rộng. Điều khoản này xác định những mục có thể được mở rộng bằng cách đăng ký và quá trình mà khả năng có thể được đăng ký, cũng như xác định những mục có thể được đăng ký mở rộng độc lập và quá trình mà theo đó các cơ quan đăng ký sẽ công bố những tiện ích mở rộng.
M.7.1 Các yếu tố đăng ký
Quá trình đăng ký bao gồm các yếu tố sau.
Bảng M.10 – Các yếu tố đăng ký
Thành phần |
Nhận biết |
Cơ quan đăng ký | WG1 |
Người đăng ký | Tổ chức tạo ra các phần mở rộng cho Tiêu chuẩn này. |
Hội đồng xét duyệt | Ủy ban định dạng tập tin WG1 |
Thông tin/hạng mục | Mở rộng được đề xuất |
Chủ tịch hội đồng xét duyệt | Người biên tập các định dạng tập tin |
Thử nghiệm | Thay đổi theo hạng mục |
Cơ quan đăng ký: Đơn vị tổ chức chịu trách nhiệm rà soát, duy trì, phân phối, và hoạt động liên quan đến việc đăng ký.
Người đăng ký: Người đăng ký là tổ chức hoặc cá nhân yêu cầu các hạng mục được đăng ký.
Hội đồng xét duyệt: Các hội đồng xét duyệt là cơ quan tổ chức đó chấp thuận việc đăng ký một hạng mục được đề xuất. Nó bao gồm một ủy ban đặc biệt được chỉ định bởi chủ tịch Hội đồng quản trị xem xét.
Chủ tịch hội đồng xét duyệt: chủ tịch Hội đồng xét duyệt là người chịu trách nhiệm xem xét mỗi hạng mục. Ông liên lạc với bên đăng ký thông qua cơ quan đăng ký.
Thử nghiệm: Cơ sở lý luận để Hội đồng quản trị xem xét nên sử dụng để xác định nếu thông tin/ hạng mục được đăng ký.
Thông tin/hạng mục: Đây là đề xuất đăng ký. Mỗi đề xuất bao gồm tên của hạng mục được mở rộng, thẻ đề xuất/nhận dạng cho phần mở rộng, và lý do/mục đích cho phần mở rộng.
M.7.2 Sự khác nhau giữa công bố và đăng ký
Trong định dạng tập tin JPX, một số tính năng của các định dạng tập tin có thể được mở rộng độc lập của một quá trình đăng ký. Ví dụ, định dạng cung cấp phương pháp Vend Hoặc Colour để cho phép các đại lý cá nhân tùy chỉnh khoảng màu thông qua một hình thức điều tra (bằng cách sử dụng UUID) mà không có liên quan đến bên thứ ba.
Tuy nhiên, để thúc đẩy khả năng tương tác, để thu thập các định nghĩa được chỉ định bởi các UUID ở một nơi là hữu ích. Trong trường hợp này, “đăng ký” của UUID không cần thiết để loại bỏ để tránh xung đột với nhà cung cấp khác, và không giúp một nhà phát triển xem xét các tính năng cần thực hiện trong một sản phẩm cụ thể.
Như vậy, đề xuất này phân biệt rõ ràng giữa các giải pháp đòi hỏi sự can thiệp của một ủy ban đăng ký từ những giải pháp có thể được tạo ra chỉ bởi các nhà cung cấp cá nhân. Đề xuất này cũng cho phép các cơ quan đăng ký gán nhãn yếu tố cụ thể được đề nghị định nghĩa như là giải pháp ưa thích.
M.7.2.1 Được công bố
Các hạng mục được công bố là những yếu tố của một tập tin JPX có thể được mở rộng một cách an toàn, thường thông qua việc sử dụng của URL hoặc UUID, không có nguy cơ xung đột với nhà cung cấp khác. Giá trị có thể được chỉ định cho các hạng mục được công bố mà không có sự giúp đỡ của một bên thứ ba. Tuy nhiên, nó là hữu ích liên quan đến bên thứ ba như một “nhà xuất bản” duy nhất của các định nghĩa của các yếu tố mở rộng từ tất cả các nhà cung cấp.
Ví dụ, một giá trị Vend Hoặc Colourspace là một hạng mục được công bố; giá trị được chỉ định bằng cách sử dụng một mã UUID. Để thúc đẩy khả năng tương tác, cơ quan đăng ký sẽ công bố một cơ sở dữ liệu của tất cả khoảng màu nhà cung cấp được biết đến và các định nghĩa đo màu kết hợp với mỗi mã UUID.
M.7.2.2 Được đăng ký
Hạng mục đã đăng ký là những yếu tố của một tập tin JPX được giới hạn số giá trị trong một giới hạn (mặc dù lớn trong một số trường hợp). Đối với những hạng mục này, có khả năng rằng hai nhà cung cấp sẽ sử dụng cùng một giá trị cho ý nghĩa khác nhau nếu không có một bên thứ ba làm trung gian cho việc sử dụng các giá trị yếu tố. Ngoài ra, trong nhiều trường hợp, có những tiêu chí bổ sung cho việc phân bổ các giá trị cho mục đăng ký. Bởi vì số lượng các giá trị có sẵn cho hạng mục đã đăng ký được giới hạn, và cho rằng hầu hết vấn đề có thể được giải quyết bằng cách sử dụng hạng mục đã được công bố chứ không phải là mục đã đăng ký, việc phân bổ của một giá trị đăng ký sẽ được coi là đặc tính của một giải pháp ưa thích.
Ví dụ, một Enumerated Colourspace là một hạng mục đăng ký; giá trị được chỉ định bằng cách sử dụng một số nguyên 4-byte. Hội đồng xét duyệt sẽ đánh giá tất cả các khoảng màu được liệt kê đề xuất trong điều khoản của công nghệ ưa thích. Đề xuất giải pháp được coi là giải pháp ưa thích sẽ được phân bổ một giá trị của Cơ quan đăng ký. Kiến nghị các giải pháp mà không phải là ưu tiên được giới thiệu đến phương pháp Vend Hoặc Colourspace như một giải pháp thay thế cho vấn đề được đề xuất.
M.7.2.3 Các giải pháp công bố được ưa thích
Preferred published solutions
Trong một số trường hợp, chẳng hạn như việc sử dụng các hộp UUID hoặc XML để nhúng siêu dữ liệu trong một tập tin JPX, không có mục đăng ký tương ứng có thể được sử dụng cho giải pháp ưa thích. Như vậy, cơ quan đăng ký, khi đề nghị từ hội đồng quản trị xem xét, có thể chọn để gán một giá trị cụ thể của một mục được công bố như là một giải pháp ưa thích.
M.7.3 Các mục có thể mở rộng bằng cách đăng ký
Các hạng mục mục sau đây có thể được mở rộng bằng cách đăng ký. Chỉ những hạng mục được liệt kê ở đây có thể được mở rộng bằng cách đăng ký.
Bảng M.11-Các đối tượng mà có thể được mở rộng bằng cách đăng ký
Mục |
Mục đích |
Các khoảng màu được liệt kê | Xác định các khoảng màu chuẩn bổ sung |
Hộp phục dựng mong muốn | Xác định các tình huống phục dựng bổ sung và các dữ liệu cần thiết để biến đổi ảnh cho các đầu ra trong những tình huống đó. |
Các chế độ tương thích | Xác định chế độ tương thích bổ sung để thúc đẩy khả năng tương tác tại các khu có địa chỉ không bởi bộ tính năng cơ bản JPX |
Danh sách tính năng chuẩn | Xác định các mã tính năng chuẩn bổ sung cho hộp Reader Requirements |
M.7.3.1 Khoảng màu được liệt kê
Các giá trị mới của trường EnumCS, hộp đặc điểm kỹ thuật của màu sắc sẽ phải. Một đề nghị để đăng ký một colourspace enumerated mới phải chứa một định nghĩa đầy đủ colourimetric rằng colourspace, hướng dẫn về làm thế nào để sử dụng ảnh trong đó colourspace, bất kỳ yêu cầu liệt kê các thông số (đối với lĩnh vực EP trong hộp màu đặc điểm kỹ thuật) và bất kỳ giá trị mặc định của những tham số. Tuy nhiên, khi đánh giá đề xuất liệt kê colourspaces, hội đồng quản trị xem xét sẽ hạn chế việc phân bổ các liệt kê giá trị để quốc tế và tiêu chuẩn defacto, ngoài việc xác định thích hợp của các giải pháp được đề xuất. Colourspaces không đúng tiêu chuẩn sẽ được xác định bằng cách sử dụng phương pháp nhà cung cấp Colourspace. Hội đồng quản trị xem xét sẽ đánh giá tất cả các bài nộp. Nếu văn bản nộp không đáp ứng các yêu cầu, sau đó nó sẽ được trả lại để nộp làm rõ.
M.7.3.2 Các hướng ngược tái bản như mong muốn
Mới hộp loại để mong muốn sao chép thông tin (như hộp đồ họa công nghệ tiêu chuẩn đầu ra ở định dạng JPX) sẽ phải. Một đề nghị để đăng ký một mới mong muốn sinh sản phải chứa một định nghĩa đầy đủ của các kịch bản sinh sản, bao gồm cả cấu trúc nhị phân của các dữ liệu sinh sản cũng như khi một ứng dụng nên sử dụng các dữ liệu sinh sản. Hội đồng quản trị xem xét sẽ đánh giá đề xuất tái tạo dựa trên các tiêu chí sau:
Hội đồng quản trị xem xét sẽ đánh giá đề xuất tái tạo dựa trên các tiêu chí sau:
– nào nó đáp ứng một nhu cầu không được đáp ứng bởi khác tái tạo được xác định?
– Là định dạng nhị phân của dữ liệu sinh sản được xác định đủ?
– Có một trường hợp chung hoặc một trường hợp cụ thể nhà cung cấp (tức là, đầu ra trên một điển hình CRT vs ra trên một mô hình CRT cụ thể từ một nhà cung cấp cụ thể)?
Hội đồng quản trị xem xét sẽ hạn chế việc phân bổ các mong muốn sao chép hộp vào trường hợp chung, đáp ứng nhu cầu chưa được đáp ứng bởi khác tái tạo được xác định. Khác tái tạo được đề xuất sẽ được xác định bởi nhúng các dữ liệu trong một hộp UUID và đặt hộp UUID đó trong vòng superbox mong muốn sao chép. Hội đồng quản trị xem xét sẽ đánh giá tất cả các bài nộp. Nếu văn bản nộp không đáp ứng các yêu cầu, sau đó nó sẽ được trả lại để nộp làm rõ.
M.7.3.3 Các chế độ tương thích
Mới chế độ tương thích cho loại tệp hộp (giá trị cho các lĩnh vực CLi) là phải. Một đề nghị để đăng ký một chế độ tương thích mới phải chứa một định nghĩa đầy đủ của các yêu cầu độc giả JPX cho rằng chế độ tương thích, cũng như định nghĩa của lĩnh vực CLi 4-byte cho chế độ này. Hội đồng quản trị xem xét sẽ đánh giá chế độ tương thích được đề xuất dựa trên các tiêu chí sau:
– Nào nó đáp ứng một nhu cầu không được đáp ứng bởi các chế độ tương thích?
– Là nó dự kiến rằng một loạt các ứng dụng sẽ mong muốn thực hiện hỗ trợ cho các thiết lập cụ thể của tính năng theo yêu cầu của chế độ tương thích này, hoặc là chế độ này dành riêng cho một nhà cung cấp cụ thể hoặc ứng dụng?
– Độc giả hỗ trợ chế độ tương thích này cần thiết để hỗ trợ JPX toàn bộ đường cơ sở tính năng thiết lập?
– Sẽ tạo ra các chế độ tương thích này ảnh hưởng đến khả năng tương tác trong khu vực ứng dụng mục tiêu?
Hội đồng quản trị xem xét sẽ hạn chế việc phân bổ các chế độ tương thích cho các trường hợp đáp ứng nhu cầu của một loạt các ứng dụng, mà không được đã đáp ứng bằng chế độ khác, và đó không tiêu cực ảnh hưởng đến khả năng tương tác trong khu vực ứng dụng mục tiêu. Việc phân bổ các chế độ để bộ tính năng mà không yêu cầu hỗ trợ cho cơ sở tính năng thiết lập sẽ bị từ chối trong trường hợp mà các tính năng cơ sở thích hợp cho các ứng dụng mục tiêu. Hội đồng quản trị xem xét sẽ đánh giá tất cả các bài nộp. Nếu văn bản nộp không đáp ứng các yêu cầu, sau đó nó sẽ được trả lại để nộp làm rõ.
M.7.3.4 Mã hóa các tính năng chuẩn
Các giá trị mới của trường SFi trong hộp đọc yêu cầu là phải. Một đề nghị để đăng ký một tính năng tiêu chuẩn mới mã colourspace phải được thực hiện cùng với đề nghị để đăng ký tính năng. Như vậy, mới tính năng tiêu chuẩn mã chỉ sẽ được phân bổ cho tính năng đăng ký mới.
M.7.4. Các mục được công bố
Các mục sau đây có thể được mở rộng mà không có sự can thiệp của cơ quan đăng ký, và các cơ quan đăng ký sẽ xuất bản các chi tiết kỹ thuật của các tiện ích mở rộng. Mặt hàng duy nhất được liệt kê ở đây sẽ được công bố. Các văn bản của phần mở rộng được công bố sẽ được đánh giá bởi Hội đồng quản trị xem xét trước khi xuất bản bởi cơ quan đăng ký. Ngoài ra, hội đồng quản trị xem xét có thể chọn nhãn cụ thể xuất bản các giải pháp như là ưa thích, như mô tả trong bảng M.12.
Bảng M.12- Các đối tượng mà có thể được mở rộng bằng cách đăng ký
Mục |
Mục đích |
Mã số tính năng của nhà cung cấp | Xác định các tính năng bổ sung cụ thể của nhà cung cấp |
Vùng màu của nhà cung cấp | Xác định thêm màu sắc của nhà cung cấp cụ thể |
Các thuật toán lọc nhị phân | Xác định thuật toán bổ sung để sử dụng trong hộp Bộ lọc nhị phân |
UUID siêu dữ liệu | Xác định bổ sung siêu dữ liệu để sử dụng trong các hộp UUID |
XML siêu dữ liệu | Xác định bổ sung siêu dữ liệu để sử dụng trong các hộp XML |
M.7.4.1 Mã tính năng nhà cung cấp
Hội đồng quản trị xem xét sẽ xuất bản định nghĩa của người bán hàng gửi tính năng mã (giá trị của trường VFi trong hộp hồ sơ ứng dụng). Tất cả các bài nộp phải bao gồm một định nghĩa đầy đủ của các tính năng, bao gồm cả cấu trúc dữ liệu được xác định, tương tác với các cấu trúc dữ liệu, và hướng dẫn về làm thế nào để thực hiện một bộ giải mã hỗ trợ tính năng đó. Hội đồng quản trị xem xét sẽ đánh giá tất cả các bài nộp. Nếu văn bản nộp không đáp ứng các yêu cầu, sau đó nó sẽ được trả lại để nộp làm rõ.
M.7.4.2 Khoảng màu nhà cung cấp
Hội đồng quản trị xem xét sẽ xuất bản định nghĩa của người bán hàng gửi colourspace mã (giá trị của lĩnh vực VCLR trong lĩnh vực METHDAT cho hộp màu đặc điểm kỹ thuật sử dụng phương pháp màu sắc nhà cung cấp). Tất cả các bài nộp phải bao gồm một định nghĩa đầy đủ colourimetric rằng colourspace, hướng dẫn về làm thế nào để sử dụng ảnh trong colourspace đó, bất kỳ tham số yêu cầu nhà cung cấp (đối với lĩnh vực VP trong hộp màu đặc điểm kỹ thuật) và bất kỳ giá trị mặc định của những tham số. Hội đồng quản trị xem xét sẽ đánh giá tất cả các bài nộp. Nếu văn bản nộp không đáp ứng các yêu cầu, sau đó nó sẽ được trả lại để nộp làm rõ.
Ngoài ra, hội đồng quản trị xem xét có thể chọn nhãn colourspace nhà cung cấp cụ thể như là một giải pháp ưa thích. Ủy ban sẽ làm cho quyết định này bằng cách sử dụng các tiêu chí tương tự như sẽ được sử dụng khi đánh giá một đề xuất cho các phân bổ của một giá trị colourspace liệt kê (theo quy định tại M.7.3.1).
M.7.4.3 Thuật toán lọc nhị phân
Hội đồng quản trị xem xét sẽ xuất bản định nghĩa của gửi filter nhị phân loại giá trị (giá trị của lĩnh vực F trong hộp Filter nhị phân). Tất cả các bài nộp phải bao gồm một định nghĩa đầy đủ của các thuật toán và các định dạng của lĩnh vực dữ liệu trong hộp lọc nhị phân. Hội đồng quản trị xem xét sẽ đánh giá tất cả các bài nộp. Nếu văn bản nộp không đáp ứng các yêu cầu, sau đó nó sẽ được trả lại để nộp làm rõ.
Ngoài ra, hội đồng quản trị có thể chọn để nhãn một bộ lọc cụ thể nhị phân như là một giải pháp ưa thích. Hội đồng quản trị phải đăng ký trước này nhãn cho tiêu chuẩn quốc tế hoặc defacto, dựa trên việc sử dụng mong muốn của các bộ lọc nhị phân. Ví dụ, công nghệ mã hóa có thể được sử dụng cho cả hai dữ liệu mã hóa và để tạo chữ ký kỹ thuật số. Trong khi một bộ lọc cụ thể nhị phân có thể là một giải pháp ưa thích cho mã hóa siêu dữ liệu, nó có thể không được ưa thích cho chữ ký số.
M.7.4.4 Siêu dữ liệu UUID
Hội đồng quản trị xem xét sẽ xuất bản định nghĩa của gửi UUID được sử dụng trong UUID hộp. Tất cả các bài nộp phải bao gồm một định nghĩa đầy đủ của lĩnh vực dữ liệu trong UUID hộp và hướng dẫn về cách sử dụng dữ liệu đó.
Hội đồng quản trị xem xét sẽ đánh giá tất cả các bài nộp. Nếu văn bản nộp không đáp ứng các yêu cầu, sau đó nó sẽ được trả lại để nộp làm rõ.
Ngoài ra, hội đồng quản trị có thể chọn để nhãn một siêu dữ liệu cụ thể đặc điểm kỹ thuật như là một giải pháp ưa thích. Ủy ban sẽ dự trữ này nhãn cho tiêu chuẩn quốc tế hoặc defacto, dựa trên các ứng dụng mục tiêu cho các siêu dữ liệu.
M.7.4.5 Siêu dữ liệu XML
Hội đồng quản trị xem xét sẽ xuất bản định nghĩa của định nghĩa loại gửi tài liệu (DTD) và lược đồ XML được sử dụng trong XML hộp. Tất cả các bài nộp phải bao gồm một định nghĩa đầy đủ của thông tin trong trường hợp tài liệu XML (tìm thấy trong hộp XML) mà sử dụng đó DTD hoặc lược đồ, cũng như các hướng dẫn về cách sử dụng dữ liệu đó.
Hội đồng quản trị xem xét sẽ đánh giá tất cả các bài nộp. Nếu văn bản nộp không đáp ứng các yêu cầu, sau đó nó sẽ được trả lại để nộp làm rõ.
Ngoài ra, các ủy ban có thể chọn để nhãn một siêu dữ liệu cụ thể đặc điểm kỹ thuật như là một giải pháp ưa thích. Ủy ban sẽ dự trữ này nhãn cho tiêu chuẩn quốc tế hoặc defacto, dựa trên các ứng dụng mục tiêu cho các siêu dữ liệu.
M.7.5 Quá trình tự đăng ký
Sau đây là trình đăng ký:
1) Người nộp một tạo ra một mục ứng cử viên cho đăng ký.
1) Mục ứng cử viên được đệ trình lên cơ quan đăng ký.
2) Cơ quan đăng ký thông mục ứng cử viên chủ tịch Hội đồng quản trị xem xét.
3) Chủ tịch Hội đồng quản trị xem xét phân phối mục ứng cử viên cho hội đồng quản trị xem xét và lịch trình các cuộc họp, gọi điện thoại, vv là thích hợp cho việc xem xét mục.
4) Nếu được chấp thuận, hội đồng chấp thuận tới các cơ quan đăng ký người thông báo cho tiêu chuẩn ISO và người nộp, và làm cho mục đăng ký hoặc xuất bản có sẵn.
5) Nếu bị từ chối, hội đồng chuẩn bị một tài liệu phản hồi và cho thấy tại sao mục đã bị từ chối và thông qua điều này để các cơ quan đăng ký người thông báo cho người nộp.
M.7.6 Hướng ngược thời gian cho quá trình đăng ký
M.7.6.1 Các yêu cầu đăng ký
Hội đồng quản trị xem xét sẽ đáp ứng tất cả yêu cầu đăng ký trong vòng năm tháng từ ngày nộp. Trong khoảng thời gian đó, hội đồng quản trị xem xét sẽ gặp gỡ tại một cuộc họp chính thức của tiêu chuẩn ISO/IEC JTC1/SC29/WG1 để đánh giá đề xuất, đưa ra quyết định, và dự thảo các phản ứng.
M.7.6.2 Các yêu cầu công bố
Hội đồng quản trị xem xét sẽ đáp ứng các yêu cầu tất cả cho công bố trong vòng hai tháng kể từ ngày nộp hồ sơ. Trong khoảng thời gian đó, hội đồng quản trị xem xét sẽ gặp nhau tại một cuộc họp chính thức của tiêu chuẩn ISO/IEC JTC1/SC29/WG1 hoặc sử dụng các cuộc thảo luận e-mail hoặc cuộc gọi hội nghị để đánh giá đề xuất, đưa ra quyết định, và dự thảo các phản ứng.
M.7.6.3 Các yêu cầu tình trạng ưa thích dành cho các giải pháp công bố
Requests f Hoặc preferred status f Hoặc published solutions
Hội đồng quản trị xem xét sẽ đáp ứng yêu cầu tất cả các tình trạng ưu tiên cho công bố giải pháp trong vòng năm tháng kể từ ngày nộp hồ sơ. Một yêu cầu cho tình trạng ưa thích có thể được thực hiện đồng thời yêu cầu cho các ấn phẩm thực hiện. Trong khoảng thời gian đó, hội đồng quản trị xem xét sẽ gặp gỡ tại một cuộc họp chính thức của tiêu chuẩn ISO/IEC JTC1/SC29/WG1 để đánh giá đề xuất, đưa ra quyết định, và dự thảo các phản ứng.
M.8 Sự khác biệt từ định nghĩa nhị phân JP2
Cấu trúc hộp của một tập tin JPX giống của tập tin JP2. Một tập tin JPX là một chuỗi các hộp, được định nghĩa trong ITU-T T.800 | TIÊU CHUẨN ISO/IEC 15444-1, I.6. Tuy nhiên, nhiều hộp mới được xác định, và các cấu trúc của một số hộp được mở rộng như sau:
– Trường BR trong hộp File Type sẽ là “jpx\040” cho các tập tin được xác định hoàn toàn bởi tiêu chuẩn này. Ngoài ra, một tập tin phù hợp với tiêu chuẩn này phải có ít nhất một trường CLi trong hộp File Type, và phải có giá trị ‘jpx\040’ trong một trong các trường CLi trong hướng ngược File Type.
– Trường MinV trong hướng ngược loại File đặt là 1 biểu thị sự xem lại là không quan trọng với tiêu chuẩn.
– Các hình thức bổ sung của hộp Đặc tính màu định nghĩa (M.11.7.2).
– Dòng mã được nén JPEG 2000 có thể chứa phần mở rộng theo quy định tại phụ lục A.
– Trong một số trường hợp, hộp tiêu đề JP2 có thể được tìm thấy ở bất cứ nơi nào trong các tập tin, miễn là nó không được đóng gói trong hộp khác (nó luôn luôn ở mức đầu của tập tin). Hãy xem M.11.5 cho một mô tả dung lượng lưu trữ của hộp tiêu đề JP2 trong tập tin JPX.
– Bổ sung loại hộp được xác định trong phạm vi của Tiêu chuẩn này.
M.9 Sự phù hợp
M.9.1 Diễn giải cấu trúc dữ liệu JPX
Tất cả các tập tin phù hợp sẽ chứa tất cả các hộp theo yêu cầu của Tiêu chuẩn này như thể hiện trong bảng M.13, và những hộp được quy định tại Tiêu chuẩn này.
Một bộ đọc JPX hỗ trợ một tập hợp con các tính năng JPX cụ thể là một bộ đọc JPX phù hợp nếu bộ đọc hỗ trợ thích hợp tất cả các file có chứa một mặt nạ Nội dung hiển thị (trong hộp Reader Requirements) hoặc một vị trí dự phòng (trong hộp File Type) chỉ ra rằng các tập tin có thể được đọc bằng cách sử dụng duy nhất tập hợp con các tính năng cụ thể; một bộ đọc phù hợp có thể phục hồi bất kỳ tính năng mở rộng nào, như được cho phép bởi hộp các yêu cầu bộ đọc hoặc File Type, miễn là bộ đọc không yêu cầu một mức độ hỗ trợ phù hợp cao hơn với thực lực của nó.
M.9.2 Hỗ trợ cho tập tính năng JPX
Nói chung, một bộ đọc JPX không yêu cầu hỗ trợ toàn bộ tính năng được xác định trong Tiêu chuẩn này. Tuy nhiên, để thúc đẩy khả năng tương tác, tập hợp các tính năng cơ bản được định nghĩa. Các tập tin được viết bằng một cách nào đó để cho phép một bộ đọc mà chỉ hỗ trợ tập hợp các tính năng cơ bản JPX này sao cho tập tin mở phù hợp phải có một trường CLi trong hộp File Type với giá trị ‘jpxb’ (0x6a70 7862); Tất cả các bộ đọc cơ bản JPX phải hỗ trợ phù hợp cho tất cả các file với mã trong danh sách tương thích này trong hộp File Type. Định nghĩa của một tập tin cơ bản JPX như sau:
M.9.2.1 Các loại nén
Hỗ trợ cho nén loại khác ngoài JPEG 2000 (trường C trong hộp Image Tiêu đề = 7) sẽ không được yêu cầu để hiển thị đúng các tập tin.
M.9.2.2 Các lớp ghép
Hỗ trợ cho nhiều lớp ghép không yêu cầu hiển thị đúng các tập tin. Tuy nhiên, tập tin có thể chứa nhiều lớp ghép. Nếu các tập tin chứa lớp ghép, các lớp ghép đầu tiên trong tập tin (báo hiệu bởi hộp Hợp lại Layer Tiêu đề đầu tiên) sẽ được kết xuất. Lớp trộn đó bao gồm một và chỉ có một dòng mã sẽ đại diện cho kết quả kết xuất như kết xuất vào một dòng mã duy nhất. Ngoài ra, dòng mã sẽ được xử lý bởi một bộ đọc mà chỉ hỗ trợ tính năng thiết lập JPX sẽ là dòng mã đầu tiên trong tập tin.
M.9.2.3 Các dòng mã
Dòng mã được xác định bởi lớp ghép đầu tiên sẽ được nén bằng thuật toán nén JPEG 2000, theo định nghĩa của ITU-T T.800 | Tiêu chuẩn ISO/IEC 15444-1 và không yêu cầu hỗ trợ cho phần mở rộng khác so với việc chuyển đổi bất tương quan không thể đảo ngược (quy định tại J.3.1.1.1) và mở rộng chuyển đổi phi tuyến tính (quy định tại phụ lục K).
Một bộ đọc cơ bản JPX phù hợp là không cần thiết để hỗ trợ các phần mở rộng nhiều thành phần chuyển đổi khác. Nếu hỗ trợ cho việc chuyển đổi bất tương quan không thể đảo ngược là cần thiết, thì dòng mã đầu tiên sẽ bị giới hạn như sau:
– Giá trị của trường Qmcc trong bất kỳ phân đoạn nhãn MCC sẽ là 1.
– Trường Xmcci trong bất kỳ phân đoạn nhãn MCC sẽ chỉ ra một ma trận dựa trên biến đổi bất tương quan.
– Trường vực Tmcci trong bất kỳ phân đoạn nhãn MCC sẽ chỉ ra một biến đổi không thể đảo ngược
– Trường Nmco trong bất kỳ phân đoạn nhãn MCO sẽ là 1.
Dòng mã đó có thể chứa các phần mở rộng khác được cung cấp hỗ trợ cho các phần mở rộng không được yêu cầu để giải mã dòng mã.
Các dòng mã trong các tập tin có thể yêu cầu hỗ trợ cho phần mở rộng khác để được giải mã.
M.9.2.4 Đặc tính màu
Lớp ghép đầu tiên phải có ít nhất một hộp Đặc tính màu từ danh sách sau:
– Phương pháp liệt kê giá trị EnumCS chỉ ra hoặc sRGB, sRGB-xám, ROMM-RGB, sYCC, e sRGB, hoặc e-sYCC.
– Phương pháp liệt kê các giá trị EnumCS của CIELab bằng cách sử dụng giá trị mặc định (trường EP không được xác định).
– Phương pháp liệt kê các giá trị EnumCS của CIELab bằng cách sử dụng tham số liệt kê (theo quy định trong các trường EP trong hộp Đặc tính màu).
– Phương pháp liệt kê các giá trị EnumCS của CIEJab bằng cách sử dụng giá trị mặc định (trường EP không được xác định).
– Phương pháp liệt kê các giá trị EnumCS của CIEJab bằng cách sử dụng tham số liệt kê (theo quy định trong các trường EP trong hộp Đặc tính màu).
– Phương pháp ICC bị giới hạn.
– Phương pháp ICC bất kỳ.
Một tập tin JPX cơ sở có thể chứa thêm các đặc tả khoảng màu, chẳng hạn như các giá trị liệt kê khác hoặc các nhà cung cấp được xác định đặc tính khoảng màu. Tuy nhiên, tập tin phải có ít nhất một phương pháp đặc tính khoảng màu từ danh sách trên.
Ngoài ra, ít nhất một hộp Đặc tính màu được chỉ định cho các lớp ghép đầu tiên sẽ có giá trị APPROX của 3 hoặc ít hơn (cho thấy một xấp xỉ “hợp lý” hoặc tốt hơn của khoảng màu ảnh trung thực).
M.9.2.5 Phân mảnh dòng mã
Dòng mã được sử dụng bởi các lớp ghép đầu tiên trong một tập tin JPX cơ bản có thể được phân mảnh. Tuy nhiên, tất cả các mảnh phải nằm trong chính tập tin JPX đó và sẽ được tìm thấy trong các tập tin theo thứ tự chúng được liệt kê trong hộp Fragment Table, bắt đầu tìm kiếm tại byte 0 của tập tin và tiến hành tuần tự đến cuối tập tin.
M.9.2.6 Hướng ngược tham chiếu chéo
Tất cả các hộp tham chiếu chéo phải được phân tích để diễn giải đúng hoặc giải mã đúng các lớp ghép đầu tiên trong các tập tin sẽ chỉ trỏ đến mảnh vỡ được chứa trong chính các tập tin JPX của nó. Những mảnh vỡ sẽ theo thứ tự trong tập tin như khi chúng được liệt kê trong hộp Fragment List, bắt đầu tìm kiếm tại byte 0 của tập tin và tiến hành tuần tự đến cuối tập tin. Ngoài ra, tất cả các mảnh vỡ sẽ được tìm thấy trong các tập tin trước khi dữ liệu đại diện cho dòng mã được sử dụng bởi các lớp ghép. Nếu dòng mã đó được chỉ định bởi một hộp Contiguous Dòng mã, thì tất cả các mảnh cho các tham chiếu chéo sẽ được tìm thấy trước khi đó hộp lục địa Dòng mã. Nếu dòng mã được chỉ định bởi một hộp mảnh bảng, sau đó tất cả các mảnh vỡ cho thiết sẽ được tìm thấy trước khi hộp Media Data có chứa mảnh đầu tiên từ dòng mã.
M.9.2.7 Vị trí hướng ngược tiêu đề JP2.
Hộp tiêu đề JP2 sẽ được tìm thấy trong các tập tin trước khi hộp Dòng mã Contiguous, hộp Fragment Table, hộp Media Data, hộp Dòng mã Tiêu đề và hộp Hợp lại Layer Tiêu đề. Bất kỳ thông tin nào chứa trong hộp tiêu đề JP2 sẽ được áp dụng cho dòng mã đầu tiên, cũng như được sử dụng như mặc định thông tin cho tất cả các dòng mã và lớp ghép; các hộp bên trong hộp tiêu đề JP2 sẽ không được tìm thấy trong hộp Hợp lại Layer Tiêu đề hoặc hộp Dòng mã Tiêu đề liên quan tới lớp ghép đầu tiên.
M.9.2.8 Độ mờ
Một bộ đọc JPX cơ bản đúng cách sẽ giải thích chính xác các kênh độ mờ, thông qua bản đồ trực tiếp một thành phần dòng mã bằng cách sử dụng hộp Channel Definition hoặc hộp Opacity, hoặc bằng cách mở rộng từ một bảng màu. Việc sử dụng các lớp ghép bên ngoài độ mờ trong tập tin JPX chỉ ra rằng các dữ liệu ảnh được mã hóa sẽ được ghép vào một nền tảng ứng dụng được xác định.
M.9.2.9 Dữ liệu khác trong tập tin
Một tập tin JPX cơ bản có thể chứa các tính năng hoặc các siêu dữ liệu khác, miễn là chúng không sửa đổi hình thức trực quan của ảnh vẫn còn như khi được xem bằng cách sử dụng một trình đọc hỗ trợ duy nhất bộ tính năng JPX cơ bản. Tất cả bộ đọc JPX cơ bản cần phải nhận thức về sự tồn tại của dữ liệu này, như phân tích cú pháp hoặc xử lý dữ liệu này có thể được yêu cầu trong một số ứng dụng mở rộng, ứng dụng hiểu dữ liệu hoặc các tính năng trong các tập tin khác được khuyến khích để hỗ trợ các hành vi và chức năng liên kết với dữ liệu mở rộng đó.
M.10 Khóa mô tả đồ họa (thông tin)
Mỗi hộp mô tả các hạng mục chức năng sử dụng và chiều dài của nó. Mô tả chức năng thông tin chứa trong hộp. Việc sử dụng mô tả địa điểm hợp lý và tần số của hộp này trong tập tin. Chiều dài mô tả tham số đó xác định chiều dài của hộp.
Những mô tả dưới các hình chỉ ra thứ tự và mối quan hệ của các tham số trong hộp. Hình vẽ M.4 Hiển thị một ví dụ về loại hình. Một hình chữ nhật được sử dụng để chỉ ra các tham số trong hộp. Chiều rộng của hình chữ nhật là tỷ lệ thuận với số lượng byte trong tham số. Một hình chữ nhật bóng mờ (sọc chéo) chỉ ra rằng các tham số có kích cỡ khác nhau. Hai tham số có các chữ và một vùng màu xám giữa chỉ ra một hoạt động của một số các tham số. Một chuỗi hai nhóm nhiều tham số với các chữ ngăn cách bởi một vùng màu xám cho biết một hoạt động của nhóm tham số đó (một tập hợp mỗi tham số trong nhóm, theo sau là tập tiếp theo của mỗi tham số trong nhóm). Tham số hoặc hộp tùy chọn sẽ được hiển thị với một hình chữ nhật nét đứt.
Các con số theo một danh sách mô tả ý nghĩa của từng tham số trong hộp. Nếu tham số được lặp đi lặp lại, chiều dài và tính chất của hoạt động của tham số được xác định. Ví dụ, trong hình M.4, tham số C, D, E và F là 8, 16, 32 bit và độ dài biến tương ứng. Ký hiệu G0 và GN-1 ngụ ý rằng đó là n thông số khác nhau, Gi, trong một hàng. Nhóm tham số H0 và HM-1, và J0 và JM-1 chỉ định rằng hộp sẽ chứa H0, theo sau là J0, theo sau là H1 và J1, tiếp tục HM-1, và JM-1 (M trường hợp của mỗi tham số trong tổng số). Ngoài ra, trường E là tùy chọn và có thể không được tìm thấy trong hộp này.
Sau khi danh sách một bảng hoặc mô tả các giá trị tham số được cho phép hoặc cung cấp tài liệu tham khảo các bảng khác mô tả những giá trị này.
Ngoài ra, trong một hình mô tả nội dung của một superbox, một dấu chấm lửng (…) sẽ được sử dụng để chỉ ra rằng nội dung của các tập tin giữa hai hộp không xác định cụ thể. Bất kỳ hộp (hoặc chuỗi các hộp), trừ khi được quy định theo định nghĩa của hộp đó, có thể được tìm thấy ở vị trí của dấu chấm lửng.
Hình M.5- Ví dụ về các superbox hình mô tả
Ví dụ, superbox hiển thị trong hình M.5 phải chứa một hộp AA và một hộp BB, và hộp BB phải tuân theo hộp AA. Tuy nhiên, có thể có các hộp khác được tìm thấy giữa hộp AA và BB. Đối phó với hộp không biết được thảo luận trong M.12.
M.11 Các hướng ngược đã xác định
Các hộp sau được xác định là một phần của định dạng tập tin JPX. Ngoài ra, bất kỳ hộp được xác định như là một phần của các định dạng tập tin JP2 mà không được liệt kê ở đây cũng được xác định để sử dụng trong một tập tin JPX. Tuy nhiên, Tiêu chuẩn này có thể xác định lại cấu trúc nhị phân của một số hộp được định nghĩa như là một phần của định dạng tập tin JP2. Đối với những hộp, được xác định trong Tiêu chuẩn này sẽ được sử dụng cho tất cả các tập tin JPX.
Hình M.6 Hiển thị phân cấp tổ chức các hộp trong một tập tin JPX. Một số các hộp được định nghĩa trong đặc tả định dạng tập tin JP2. Minh họa này không chỉ rõ hay ngụ ý một thứ tự cụ thể cho các hộp. Trong nhiều trường hợp, các tập tin sẽ chứa một số hộp của một loại hộp cụ thể. Ý nghĩa của mỗi hộp phụ thuộc vào vị trí và thứ tự hộp cụ thể trong các tập tin.
Hình M.6- Hộp được xác định trong tập tin JPX
Bảng M.13 liệt kê tất cả các hộp được định nghĩa như là một phần của Khuyến nghị | Tiêu chuẩn quốc tế này. Hộp được định nghĩa như là một phần của định dạng tập tin JP2 không được liệt kê. Một hộp được liệt kê trong bảng M.13 như “Yêu cầu” sẽ tồn tại trong tất cả các tập tin JPX phù hợp. Đối với vị trí của mỗi hộp và hạn chế đối với mỗi hộp, xem mục con có liên quan để xác định hộp.
Bảng M.13- Hộp được xác định trong đề tiêu chuẩn này
Tên hộp |
Loại |
Yêu cầu ? |
Ghi chú |
Hộp các yêu cầu bộ đọc (M.11.1) |
‘rreq’ (0x7272 6571) |
Có |
Hộp này quy định các chế độ khác nhau, trong đó tập tin này có thể được xử lý. |
Hộp đầu JP2 (siêu hộp) (M.11.5) |
‘jp2h’ (0x6A70 3268) |
Không |
Hộp này xác định khả năng tương thích JP2 và thông tin tiêu đề mặc định cho các dòng mã và các lớp ghép. |
Hộp đầu ảnh (M.11.5.1) |
‘ihdr’ (0x6968 6472) |
Có |
Hộp này quy định các kích thước của ảnh và các trường liên quan khác. |
Hộp các bit mỗi thành phần (M.11.5.2) |
‘bpcc’ (0x6270 6363) |
Không |
Hộp này quy định các độ sâu bit của các thành phần trong các tập tin trong trường hợp độ sâu bit là không liên tục trên tất cả các thành phần. |
Hộp đầu dòng mã (siêu hộp) (M.11.6) |
‘jpch’ (0x6A70 6368) |
Không |
Hộp này quy định các thông tin chung, chẳng hạn như chiều sâu, chiều cao và chiều rộng bit khoảng một dòng mã cụ thể trong tập tin |
Hộp đầu lớp kết hợp (siêu hộp) (M.11.1.7) |
‘jplh’ (0x6A70 6C68) |
Không |
Hộp này quy định các thông tin chung, chẳng hạn như không gian màu và độ phân giải, về một lớp hợp cụ thể trong tập tin. |
Hộp nhóm màu (siêu hộp) (M.11.7.1) |
‘cgrp’ (0x6367 7270) |
Không |
Hộp này nhóm một chuỗi các hộp đặc tính màu mà xác định những cách khác nhau mà các không gian màu của một lớp có thể được xử lý. |
Đặc tính màu box (M.11.7.2) |
‘colr’ (0x636F 6C72) |
Có |
Hộp này quy định một trong những cách mà không gian màu của một ảnh có thể được xử lý. Định nghĩa của hộp này được mở rộng từ định nghĩa trong các định dạng tập tin JP2. |
Hộp tính mờ đục (M.11.7.6) |
‘opct’ (0x6F70 6374) |
Không |
Hộp này quy định cách thông tin tính mờ đục được chứa trong một tập hợp các kênh. |
Hộp đăng kí dòng mã (M.11.7.7) |
‘creg’ (0x6372 6567) |
Không |
Hộp này quy định các liên kết giữa các bộ dòng mã tạo nên một lớp ghép. |
Hộp tham chiếu dữ liệu (M.11.2) |
‘dtbl’ (0x6474 626C) |
Không |
Hộp này có chứa một tập hợp các con trỏ đến các tập tin hoặc dòng dữ liệu khác không nằm trong các tập tin JPX chính nó. |
Hộp bảng phân mảnh (siêu hộp) (M.11.3) |
‘ftbl’ (0x6674 626C) |
Không |
Hộp này quy định cách một dòng mã cụ thể đã được phân mảnh và được lưu trữ trong tập tin JPX này hoặc trong các dòng. |
Hộp danh sách mảnh (M.11.3.1) |
‘flst’ (0x666C 7374) |
Không |
Hộp này quy định một danh sách các mảnh tạo nên một dòng mã cụ thể trong tập tin JPX này. |
Hộp tham chiếu chéo (M.11.4) |
‘cref’ (0x6372 6566) |
Không |
Hộp này quy định một hộp tìm thấy trong một vị trí khác (hoặc trong tập tin JPX hoặc trong một tập tin khác) cần được xem xét như thể nó đã chứa đựng trực tiếp tại địa điểm này trong tập tin JPX. |
Hộp dòng mã liền nhau (M.11.8) |
‘jp2c’ (0x6A70 3263) |
Không |
Hộp này có chứa một dòng mã từ tập tin JPX, lưu trữ liên tục trong một hộp duy nhất |
Hộp dữ liệu âm thanh (M.11.9) |
‘mdat’ (0x6064 6174) |
Không |
Hộp này có chứa phương tiện truyền thông dữ liệu chung được tham chiếu thông qua hộp bảng các mảnh. |
Hộp tập hợp (siêu hộp) (M.11.10) |
‘comp’ (0x636F 6D70) |
Không |
Hộp này quy định cách một tập hợp các lớp hợp lại sẽ được kết hợp để tạo ra các kết quả trả lại. |
Hộp tùy chọn kết hợp (M.11.10.1) |
‘copt’ (0x636F 7074) |
Không |
Hộp này quy định tùy chọn chung cho các thành phần của nhiều lớp ghép. |
Hộp thiết lập hướng dẫn (M.11.10.2) |
‘inst’ (0x696E 7374) |
Không |
Hộp này quy định hướng dẫn cụ thể để kết hợp nhiều lớp hợp lại để tạo ra các kết quả trả lại. |
Hộp liên kết (siêu hộp) (M.11.11) |
‘asoc’ (0x6173 6F63) |
Không |
Hộp này cho phép một số hộp khác (ví du, hộp chứa siêu dữ liệu) được nhóm lại với nhau và tham chiếu như là một thực thể duy nhất. |
Hộp danh sách số lượng (M.11.12) |
‘nlst’ (0x6E6C 7374) |
Không |
Hộp này quy định những gì các đơn vị có liên quan đến các dữ liệu chứa trong một hộp Hiệp hội. |
Hộp nhãn hiệu (M.11.13) |
‘lbl\040’ (0x6062 6C20) |
Không |
Hộp này quy định một nhãn văn bản hoặc là một dòng mã đầu, đầu lớp kết hợp, hoặc hộp Hiệp hội. |
Hộp bộ lọc nhị phân (M.11.14) |
‘bfil’ (0x6266 696C) |
Không |
Hộp này có chứa dữ liệu đã được chuyển đổi như một phần của quá trình lưu trữ (như nén hoặc mã hóa). |
Hộp bản sao mong muốn (siêu hộp) (M.11.15) |
‘drep’ (0x6472 6570) |
Không |
Hộp này quy định một tập hợp các biến đổi đó phải được áp dụng cho các ảnh để đảm bảo tái sản xuất mong muốn cụ thể về một tập hợp các thiết bị đầu ra cụ thể. |
Hộp đầu ra tiêu chuẩn công nghệ đồ họa (M.11.15.1) |
‘gtso’ (0x6774 736F) |
Không |
Hộp này quy định các sao chép mong muốn kết quả trả lại cho hệ thống in ấn và chống thương mại. |
Hộp mô tả ROI (M.11.16) |
‘roid’ (0x726F 6964) |
Không |
Hộp này xác định thông tin về các khu vực cụ thể quan tâm trong các ảnh. |
Hộp chữ kí số (M.11.17) |
‘chck (0x6368 636B) |
Không |
Hộp này có chứa một kiểm tra hoặc chữ ký kỹ thuật số cho một phần của tập tin JPX. |
Hộp nhị phân MPEG-7 (M.11.19) |
‘mp7b’ (0x6070 3762) |
Không |
Hộp này có chứa siêu dữ liêu ở định dạng nhị phân MPEG-7 (BiM) theo quy định của tiêu chuẩn ISO/IEC 15.938) |
Hộp tự do (M.11.20) |
‘free’ (0x6672 6565) |
Không |
Hộp này có chứa dữ liệu không còn được sử dụng và có thể được ghi đè khi tệp tin được cập nhật. |
Quyền sở hữu trí tuệ (N.5.4) |
‘ipr’ (0x6A70 3269) |
Không |
Hộp này có chứa thông tin quyền sở hữu trí tuệ. |
M.11.1 Hướng ngược các yêu cầu kết xuất
Hộp các yêu cầu bộ đọc xác định những tính năng cụ thể hoặc tính năng nhóm đã được sử dụng trong tập tin JPX này, cũng như sự kết hợp của tính năng được hỗ trợ bởi một bộ đọc để sử dụng hoàn toàn các tập tin. Hộp các yêu cầu bộ đọc phải ngay lập tức tuân theo hộp File Type, và có một và chỉ có một hộp các yêu cầu bộ đọc trong các tập tin.
Tất cả các đặc điểm đã được đặc tả là thêm vào các đặc trưng đã được định nghĩa bởi định dạng tập tin JP2 và dòng mã JPEG 2000 dạng 0; điều đó có nghĩa rằng bất kỳ bộ đọc nào có khả năng đọc một tập tin JPX cũng có khả năng hiểu được từng đặc điểm đã được định nghĩa trong định dạng tập tin JP2 và giải mã dòng mã JPEG 2000 dạng 0.
Hướng ngược này sẽ chứa một đặc tính chính xác, với phần mở rộng như đã biết bởi bộ ghi, tất cả các đặc điểm trong tập tin và một đặc tính chính xác của tập hoặc bộ các đặc điểm được yêu cầu để hiển thị ảnh như đã định dùng bởi bộ ghi.
Chú thích – Nếu một tập tin JPX không chứa các đặc điểm khác được định nghĩa bởi định dạng tập tin JP2 và dòng mã JPEG 2000 dạng 0 hoặc nếu bộ đọc không nhận biết bất kỳ đặc điểm nào đã chứa trong tập tin về phía các đặc trưng cơ bản đó, hướng ngược Reader Requirements sẽ liệt kê những chuẩn 0 và các đặc điểm nhà cung cấp 0.
Nhiều đặc trưng từ những xem xét trước của tiêu chuẩn này đã Không được chấp nhận. Các bộ ghi sẽ không bao hàm những đặc điểm này khi tạo ra hoặc cập nhật các tập tin. Các bộ đọc sẽ bỏ qua sự góp phần của các đặc trưng này khi quyết định hoặc chúng có thể hoặc không thể đọc được tập tin.
Loại hộp các yêu cầu bộ đọc sẽ là ‘rreq’ (0x7272 6571′). Nội dung của các hộp các yêu cầu bộ đọc như sau:
Hình M.7-Tổ chức nội dung của hộp yêu cầu đọc
ML: Chiều dài Mặt nạ. Trường này là một byte chỉ định số lượng byte được sử dụng cho các mặt nạ có khả năng tương thích. Trường này được mã hóa là một số nguyên không dấu 1-byte.
FUAM: Mặt nạ hiểu đầy đủ các khía cạnh. Trường này là mặt nạ mô tả sự biểu hiện Fully Underst và Aspects. Trường này được quy định như một số nguyên big endia của kích thước theo quy định của trường ML.
DCM: Mặt nạ giải mã hoàn toàn. Trường này là mặt nạ mô tả biểu thức để hiển thị ảnh một cách chính xác. Trường này được quy định như một số nguyên big endian của kích thước theo quy định của trường ML.
NSF: Số cờ tiêu chuẩn. Trường này chỉ định số lượng cờ tính năng tiêu chuẩn chứa trong hộp đọc yêu cầu. Giá trị của trường này tương đương với số trường SFi tìm thấy trong hộp Reader Requirements. Trường này được mã hóa như một số nguyên big endia 2-byte.
SFi: Cờ chuẩn. Trường này chỉ định một cờ đặc trưng chuẩn, số của các trường SFi sẽ bằng giá trị của trường NSF. Trường này được mã hóa như một số nguyên không được ký big endian 2-byte. Các giá trị hợp lệ của trường này được đặc tả trong bảng M.14 và trong phần mở rộng của tiêu chuẩn này.
SMi: Tiêu chuẩn mặt nạ. Trường này xác định mặt nạ khả năng tương thích cho các tính năng được chỉ định bởi SFI. Trường này được quy định như một số nguyên big endia của kích thước theo quy định của trường ML..
NVF: Số tính năng nhà cung cấp. Trường này chỉ định số tính năng nhà cung cấp được chỉ định trong hộp đọc yêu cầu. Giá trị của Trường này sẽ là tương đương với số Trường VFi trong hộp đọc yêu cầu. Trường này được mã hóa như một số nguyên big endia 2-byte
VFi: tính năng Nhà cung cấp. Trường này chỉ định một tính năng nhà cung cấp xác định được sử dụng trong tập tin JPX. Trường này được mã hóa như một UUID 128-bit. Thông tin về các tính năng được chỉ định bởi UUID có thể được xác định bằng cách sử dụng hộp thông tin UUID theo quy định trong định dạng tập tin JP2.
VMi: mặt nạ Nhà cung cấp. Trường này xác định mặt nạ có khả năng tương thích cho các tính năng được chỉ định bởi VFi. Trường này được quy định như một số nguyên big endia của kích thước theo quy định của trường ML.
Bảng M.14 – Các giá trị hợp lệ của trường SFi
Giá trị |
Ý nghĩa |
0 |
Tập tin không hiểu đầy đủ |
1 |
Không được chấp nhận |
2 |
Chứa nhiều lớp ghép hợp |
3 |
Không được chấp nhận |
4 |
Dòng mã JPEG 2000 Part 1 Profile 1 như được định nghĩa trong ITU-T Rec. T.800 | ISO/IEC 15444-1, A.10, Bảng A.45 |
5 |
Không hạn chế dòng mã JPEG 2000 Part 1 như đã định nghĩa trong ITU-T Rec. T.800 | ISO/IEC 15444-1 |
6 |
Không hạn chế dòng mã JPEG 2000 Part 2 như đã định nghĩa trong tiêu chuẩn này |
7 |
Dòng mã JPEG như đã định nghĩa trong ISO/IEC 10918-1 |
8 |
Không được chấp nhận |
9 |
Kênh độ mờ không được ghép trước |
10 |
Kênh độ mờ ghép trước |
11 |
Khóa màu trên cơ sở độ mờ |
12 |
Không được chấp nhận |
13 |
Dòng mã phân mảnh nơi tất cả các phân mảnh trong tập tin và theo thứ tự |
14 |
Dòng mã phân mảnh nơi tất cả các phân mảnh trong tập tin nhưng không theo thứ tự |
15 |
Dòng mã phân mảnh nơi không phải tất cả các phân mảnh trong tập tin mà tất cả trong các tập tin có khả năng truy cập cục bộ |
16 |
Dòng mã phân mảnh nơi một số phân mảnh có thể có khả năng truy cập chỉ thông qua kết nối mạng đã đặc tả URL |
17 |
Ghép hợp yêu cầu với sản phẩm kết xuất từ nhiều lớp ghép hợp |
18 |
Không được chấp nhận |
19 |
Không được chấp nhận |
20 |
Không được chấp nhận |
21 |
Ít nhất một lớp ghép có trong nhiều dòng mã |
22 |
Không được chấp nhận |
23 |
Các biến đổi khoảng màu được yêu cầu để kết hợp các lớp ghép; không phải tất cả các lớp ghép có cùng khoảng màu |
24 |
Không được chấp nhận |
25 |
Ảnh động |
26 |
Lớp ảnh động thứ nhất không bao phủ toàn bộ vùng hiệu quả kết xuất |
27 |
Không được chấp nhận |
28 |
Tái sử dụng các lớp ảnh động |
29 |
Không được chấp nhận |
30 |
Một số hướng ngược ảnh động liên tục |
31 |
Không được chấp nhận |
32 |
Hiệu quả kết xuất bao hàm tỷ lệ trong một lớp |
33 |
Hiệu quả kết xuất bao hàm tỷ lệ giữa các lớp |
34 |
Siêu dữ liệu ROI |
35 |
Siêu dữ liệu IPR |
36 |
Siêu dữ liệu nội dung |
37 |
Siêu dữ liệu lịch sử |
38 |
Siêu dữ liệu tạo ra |
39 |
Ký số JPX |
40 |
Kiểm tra tổng JPX |
41 |
Đặc tả tái bản nghệ thuật đồ họa mong muốn |
42 |
Không được chấp nhận |
43 |
Không được chấp nhận |
44 |
Lớp ghép sử dụng dạng ICC bất kỳ |
45 |
Không được chấp nhận |
46 |
Không được chấp nhận |
47 |
Khoảng màu đánh số hai mức 1 |
48 |
Khoảng màu đánh số hai mức 2 |
49 |
Khoảng màu đánh số YCbCr 1 |
50 |
Khoảng màu đánh số YCbCr 2 |
51 |
Khoảng màu đánh số YCbCr 3 |
52 |
Khoảng màu đánh số PhotoYCC |
53 |
Khoảng màu đánh số YCCK |
54 |
Khoảng màu đánh số CMY |
55 |
Khoảng màu đánh số CMYK |
56 |
Khoảng màu đánh số CIELab có các tham số mặc định |
57 |
Khoảng màu đánh số CIELab có các tham số không mặc định |
58 |
Khoảng màu đánh số CIEJab có các tham số mặc định |
59 |
Khoảng màu đánh số CIEJab có các tham số không mặc định |
60 |
Khoảng màu đánh số e-sRGB |
61 |
Khoảng màu đánh số ROMM-RGB |
62 |
Các mẫu không vuông |
63 |
Không được chấp nhận |
64 |
Không được chấp nhận |
65 |
Không được chấp nhận |
66 |
Không được chấp nhận |
67 |
Hướng ngược XML siêu dữ liệu GIS |
68 |
Phần mở rộng JPSEC trong dòng mã như đặc tả bởi ISO/IEC 15444-8 |
69 |
Phần mở rộng JP3D trong dòng mã như đặc tả bởi ISO/IEC 15444-10 |
70 |
Không được chấp nhận |
71 |
Khoảng màu đánh số e-sYCC |
72 |
Dòng mã JPEG 2000 Part 2 bị hạn chế bởi các yêu cầu tương thích đường cơ sở M.9.2.3 |
73 |
Khoảng màu đánh số YPbPr(1125/60) |
74 |
Khoảng màu đánh số YPbPr(1250/50) |
Other giá trị |
Dự trữ để ISO sử dụng |
Bảng M.15 – Định dạng của nội dung của hộp yêu cầu đọc
Tên trường |
Kích thước (bits) |
Giá trị |
ML |
8 |
1, 2, 4 Hoặc 8 |
FUAM |
8 x ML |
Biến đổi |
DCM |
8 x ML |
Biến đổi |
NSF |
16 |
0-65 535 |
SFi |
16 |
0-65 535 |
SMi |
8 x ML |
Biến đổi |
NVF |
16 |
0-65 535 |
VFi |
128 |
Biến đổi |
VMi |
8 x ML |
Biến đổi |
M.11.2 Hướng ngược tham chiếu dữ liệu
Hộp tham chiếu dữ liệu có một ma trận URL được tham chiếu bởi tập tin này. Nhiều dữ liệu trong số những tài liệu tham khảo sẽ từ hộp Fragment Table, xác định vị trí của các mảnh vỡ dòng mã. Tham khảo khác sẽ từ các hộp tham chiếu chéo (tham chiếu chéo). Một tập tin JPX sẽ chứa không hay một hộp tham chiếu dữ liệu, và hộp tham chiếu dữ liệu đó sẽ ở mức độ hàng đầu của tập tin; nó không phải trong bất kỳ superboxes nào. Hộp tham chiếu dữ liệu không phải là một superbox bởi vì nó không chỉ chứa hộp. Loại hộp dữ liệu tham khảo là ‘dtbl’ (0x6474 626C), và nội dung của nó sẽ như sau:
Tìm M.8- Tổ chức nội dung của một hộp tham chiếu dữ liệu
NDR: Số lượng dữ liệu tham khảo. Trường này xác định số lượng dữ liệu tham khảo, và do đó số lượng hộp URL chứa trong hộp tham chiếu dữ liệu này.
DRi: Dữ liệu tham khảo URL. Trường này có chứa một hộp dữ liệu nhập URL (Data Entry URL), như được định nghĩa trong ITU-T T.800 | TIÊU CHUẨN ISO/IEC 15444-1, I.7.3.2. Tuy nhiên, trong ngữ cảnh này, trường Location trong hộp là không cụ thể cho hộp thông tin UUID. Ý nghĩa của URL được chỉ định trong ngữ cảnh của hộp đề cập đến các mục cụ thể trong hộp dữ liệu tham khảo.
Các chỉ số của các yếu tố trong các ma trận của trường DRi là dựa trên 1; một tham chiếu dữ liệu của 1 trong trường DRi trong một hộp Fragment List xác định dữ liệu tham khảo URL đầu tiên chứa trong các hộp dữ liệu tham khảo. Dữ liệu tham khảo giá trị 0 là một trường hợp đặc biệt chỉ ra rằng tài liệu tham khảo để dữ liệu chứa trong chính tập tin JPX này.
Bảng M.16 – Định dạng của nội dung của hộp tham chiếu dữ liệu
Tên trường |
Kích thước (bits) |
Giá trị |
NDR |
16 |
0-65 535 |
DRI |
Biến đổi |
Biến đổi |
M.11.3 Hướng ngược bảng phân mảnh (superbox)
Một hộp Fragment Table chỉ định vị trí của một trong những dòng mã trong một tập tin JPX. Một tập tin có thể chứa không hay nhiều hộp Fragment Table. Với mục đích đánh số các dòng mã, hộp Fragment Table sẽ được coi là tương đương với một hộp Contiguous Dòng mã Hộp Fragment Table sẽ được tìm thấy chỉ ở cấp cao nhất của các tập tin; chúng sẽ không được tìm thấy trong một superbox. Loại hộp Fragment Table sẽ là ‘ftbl’ (0x6674 626C), và nội dung của nó sẽ như sau:
Hình M.9- Tổ chức nội dung của một hộp bảng mảnh
Fist: Danh sách Fragment. Trường này chứa một hộp Fragment List theo quy định tại M.11.3.1.
M.11.3.1 Hướng ngược danh sách mảnh
Hộp danh sách mảnh chỉ định vị trí, chiều dài và trật tự của mỗi mảnh vỡ đó, một kết hợp, tạo thành một dòng dữ liệu hợp lệ và đầy đủ. Tùy thuộc vào những gì hộp chứa hộp Fragment List cụ thể này, hình thức dòng dữ liệu hoặc là một dòng mã (nếu hộp Fragment List được chứa trong một hộp Fragment Table) hoặc chia sẻ các tiêu đề hoặc siêu dữ liệu (nếu hộp Fragment List được chứa trong một hộp tham chiếu chéo).
Nếu hộp Fragment List này nằm trong một hộp Fragment Table (và do đó xác định vị trí của một dòng mã), sau đó bù đắp đầu tiên trong danh sách mảnh sẽ trỏ trực tiếp đến các byte đầu tiên dòng mã dữ liệu; nó sẽ không trỏ đến tiêu đề của hộp có chứa đoạn dòng mã đầu tiên.
Nếu hộp Fragment List này nằm trong một hộp tham chiếu chéo (và do đó xác định vị trí của tiêu đề được chia sẻ hoặc siêu dữ liệu), thì bù đầu tiên trong danh sách mảnh sẽ trỏ đến các byte nội dung đầu tiên của hộp tham chiếu; nó sẽ không chỉ vào tiêu đề của hộp tham chiếu. Tuy nhiên, nếu hộp tham chiếu là một superbox, thì bù của đoạn đầu tiên chỉ tiêu đề hộp của hộp đầu tiên chứa trong superbox.
Đối với tất cả các offsets khác trong hộp danh sách mảnh, các offsets sẽ chỉ trực tiếp đến các byte đầu tiên của dữ liệu mảnh và không đề các tiêu đề của hộp có chứa đoạn đó.
Ngoài ra, một offset trong bất cứ Fragment List sẽ không chỉ vào một hộp Binary Filter. Nếu các tập tin JPX chứa một hoặc nhiều hộp Binary Filter, thì tất cả các offset trong tất cả các hộp Fragment list sẽ được giải thích độ dài của các hộp Binary Filter, như được lưu trữ trong các tập tin, không phải là độ dài của dữ liệu sau khi áp dụng các bộ lọc. Loại hộp Fragment List sẽ là ‘flst’ (0x666C 7374) và nó sẽ có nội dung như sau:
Hình M.10 – Tổ chức nội dung của một hộp danh sách mảnh
NF: Số lượng các mảnh vỡ. Trường này chỉ định số đoạn được dùng để chứa các dòng dữ liệu, số lượng bản ghi {OFF, LEN, DR} trong hộp Fragment list sẽ là số lượng giá trị trường NF.
OFFi: offset. Trường này chỉ định offset cho sự bắt đầu của các đoạn trong tệp đã chỉ định. Các offset là tương đối so với các byte đầu tiên của tập tin (ví dụ, byte đầu tiên của lĩnh vực độ dài tiêu đề hộp chữ ký JPEG 2000 cho một tập tin JPX). Trường này được mã hóa như là một số nguyên không dấu 64-bit.
LENi: Chiều dài mảnh. Trường này xác định chiều dải của mảnh. Giá trị này chỉ bao gồm là các dữ liệu thực tế và không phải bất kỳ tiêu đề của một hộp đóng gói. Trường này được mã hóa như là một số nguyên không dấu 32-bit.
DRi: Dữ liệu tham khảo. Trường này chỉ định các tập tin dữ liệu hoặc nguồn tài nguyên có chứa đoạn này. Nếu giá trị của Trường này là zero, thì các đoạn được chứa trong tập tin này. Nếu giá trị không phải là zero, thì các đoạn được chứa trong các tập tin được chỉ định bởi chỉ số này vào ma trận của trường DRi trong các hộp Data Reference, trong đó giá trị chỉ số của 1 cho thấy các yếu tố đầu tiên trong ma trận đó. Trường này được mã hóa như là một số nguyên dấu 16-bit.
Bảng M.17 – Định dạng của nội dung của hộp danh sách mảnh
Tham số |
Kích thước (bits) |
Giá trị |
NF |
16 |
0-65 535 |
OFFi |
64 |
12-(264-1) |
LENi |
32 |
0-(232-1) |
DRi |
16 |
0-65 535 |
M.11.4 Hướng ngược tham chiếu chéo
Nếu một tập tin JPX có chứa nhiều dòng mã hoặc lớp ghép, nó có thể hữu ích để chia sẻ các tiêu đề và siêu dữ liệu thông tin giữa các dòng mã hoặc lớp ghép nhằm giảm thiểu kích thước tập tin. Một cơ chế chia sẻ dữ liệu như vậy để đặt một tham chiếu chép cho hộp tiêu đề hoặc hộp siêu dữ liệu thực tế vào hộp Dòng mã Tiêu đề hoặc Hợp lại Layer thay cho các dữ liệu thực tế. Điều này được thực hiện bằng cách sử dụng một hộp tham chiếu chéo. Một tập tin JPX có thể chứa không hay nhiều hộp tham chiếu chéo, và hộp tham chiếu chéo sẽ được tìm thấy chỉ trong hộp Dòng mã Tiêu đề, Hợp lại Layer Tiêu đề hoặc Association. Ngoài ra, một hộp tham chiếu chéo sẽ không trỏ đến một hộp tham chiếu chéo khác. Ngoài ra, bởi vì hộp tham chiếu chéo có một trường tiếp theo là một hộp, hộp tham chiếu chéo không phải là một superbox.
Loại hộp tham chiếu chéo sẽ là ‘cref’ (0x6372 6566 người) và nó sẽ có nội dung như sau:
Hình M.11 – Tổ chức nội dung của một hộp bảng mảnh
Rtyp: Loại hộp tham chiếu. Trường này chỉ định các loại thực tế (sẽ được tìm thấy trong Trường TBox trong một tiêu đề hộp thực tế) của hộp được tham chiếu bởi hộp tham chiếu chéo này. Tuy nhiên, một bộ đọc sẽ không cố gắng xác định tiêu đề hộp được lưu trữ vật lý cho hộp đại diện bởi hộp tham chiếu chéo này, vì nó hợp pháp để sử dụng một hộp tham chiếu chéo nhằm tạo ra một hộp mới không liên tiếp chứa trong các vị trí khác trong tập tin này hoặc các tập tin khác, và do đó tiêu đề hộp sẽ không tồn tại.
fist: hộp danh sách mảnh. Hộp này chỉ định vị trí thực tế các mảnh vỡ của hộp tham chiếu. Khi những mảnh vỡ đã được nối, theo thứ tự, theo quy định của hộp Fragment List, kết quả các dòng byte sẽ là nội dung của hộp tham chiếu và không bao gồm các trường tiêu đề hộp. Tuy nhiên, nếu hộp tham chiếu là một superbox, thì offset của đoạn đầu tiên chỉ tiêu đề hộp của hộp đầu tiên chứa trong superbox. Định dạng của hộp Fragment Danh sách được quy định tại M.11.3.1.
Bảng M.18- Định dạng của nội dung của hộp tham chiếu chéo
Tham số |
Kích thước (bits) |
Giá trị |
Rtyp |
32 |
0-(232-1) |
fist |
Biến đổi |
Biến đổi |
M.11.5 Hướng ngược tiêu đề JP2 (siêu khung)
Hộp tiêu đề JP2 có cú pháp không thay đổi từ các cấu trúc được định nghĩa trong các định dạng tập tin JP2. Tuy nhiên, nếu các tập tin JPX có chứa nhiều dòng mã hoặc nhiều lớp ghép, thì bất kỳ hộp chứa trong hộp tiêu đề JP2 sẽ được xem xét như mặc định cho tất cả các dòng mã và lớp ghép. Ví dụ, nếu một hộp Hợp lại Layer Tiêu đề không chỉ định một đặc tả khoảng màu, thì một bộ đọc sẽ áp dụng các đặc tả khoảng màu chứa trong hộp tiêu đề JP2 đó cho lớp ghép cụ thể.
Cũng như, nếu hướng ngược tiêu đề JP2 đặc tả thông tin ngẫu nhiên đối với các dòng mã bất kỳ, thì quan hệ ngữ nghĩa của hướng ngược tiêu đề ảnh và các bit trong mỗi hướng ngược ghép được chứa trong hướng ngược tiêu đề JP2 sẽ theo các quy định như sau được định nghĩa trong M.11.5.1 và M.11.5.2 tương ứng.
Ngoài ra, định dạng tập tin JPX cho phép hộp tiêu đề JP2 đặt bất cứ nơi nào tại mức cao nhất của tập tin (nhưng không phải trong bất kỳ superbox nào). Tuy nhiên, một số vị trí dự phòng, chẳng hạn như định nghĩa đường cơ sở JPX, có thể hạn chế các vị trí của hộp này. Ngoài ra, nếu tập tin này không cần hộp tiêu đề JP2 đề đáp ứng các yêu cầu của một vị trí dự phòng, và cũng không sử dụng hộp tiêu đề JP2 để chỉ định mặc định thông tin cho nhiều lớp ghép hoặc dòng mã, thì hộp này có thể được bỏ qua từ các tập tin.
M.11.5.1 Hướng ngược tiêu đề ảnh
Định dạng và cấu trúc của hộp Image Tiêu đề là giống hệt với quy định trong 1.5.3.1 tại ITU-T T.800 | Tiêu chuẩn ISO/IEC 15444-1 trong định dạng tập tin JP2. Tuy nhiên, các giá trị bổ sung của các trường trong hộp đó được xác định cho các định dạng tập tin JPX. Trong một tập tin JPX, hộp này có thể được tìm thấy trong hộp tiêu đề JP2 hoặc bên trong hộp Dòng mã Tiêu đề.
Loại hộp Image Tiêu đề sẽ là ‘ihdr’ (0x6968 6472) và nội dung của hộp sẽ có định dạng sau:
Hình M.12- Tổ chức nội dung của một hộp tiêu đề ảnh
Height: chiều cao khu vực ảnh. Giá trị của trường này là giống với định nghĩa cho các định dạng tập tin JP2.
WIDTH: Ảnh khu vực rộng. Giá trị của trường này là giống với định nghĩa cho các định dạng tập tin JP2.
NC: Số lượng các thành phần. Giá trị của trường này là giống với định nghĩa cho các định dạng tập tin JP2.
BPC: Bits cho mỗi thành phần. Tham số này xác định độ sâu bit của các thành phần giải nén đầy đủ, trừ đi 1, và được lưu giữ như một trường 1-byte. Điều này sẽ đại diện cho độ sâu bit của các thành phần sau khi chuyển đổi bất kỳ thành phần nhiều hướng ngược hoặc gia hạn chuyển đổi phi tuyến tính hướng ngược đã được áp dụng. Tuy nhiên, nếu loại nén của dòng mã tương ứng với hộp ảnh tiêu đề này không phải là JPEG 2000 hoặc nếu không phải là thành phần nhiều hoặc gia hạn phi tuyến tính được sử dụng trong các dòng mã, thì giá trị của trường này trong hộp này sẽ phù hợp với các bit tương ứng mỗi thành phần dữ liệu trong các đặc tả định dạng dòng mã tương ứng.
Nếu độ sâu bit là như nhau cho tất cả các thành phần, sau đó tham số này xác định rằng độ sâu bit và sẽ tương đương với các bit độ sâu quy định trong dòng mã bằng cách sử dụng cấu trúc dữ liệu định nghĩa cho rằng định dạng dòng mã cụ thể. Nếu các thành phần khác nhau về độ sâu bit, thì giá trị của lĩnh vực này sẽ là 255, và superbox có chứa hộp ảnh tiêu đề này (một trong hai hộp JP2 Tiêu đề hoặc một hộp Dòng mã Tiêu đề) phải có một thành phần Bits trên hộp xác định độ sâu bit của mỗi thành phần (theo quy định tại 1.5.3.2 trong ITU-T Rec T.800 |. ISO / IEC 15.444-1 trong các định dạng tập tin JP2). Thành phần nên được coi là có độ sâu bit khác nhau nếu một trong hai mức độ hoặc dấu hiệu của các bit độ sâu của các thành phần khác nhau.
Mức thấp nhất 7-bit của giá trị chỉ ra độ sâu bit của các thành phần. Các-bit cao chỉ ra cho dù các thành phần được ký kết hoặc unsigned. Nếu bit cao là 1, thì các thành phần chứa các giá trị đã ký kết. Nếu bit cao là 0, thì các thành phần chứa các giá trị chưa ký kết.
C: Loại nén. Tham số này quy định các thuật toán nén được sử dụng đề nén dữ liệu ảnh. Giá trị hợp lệ của lĩnh vực này như sau:
Bảng M.19 – Giá trị hợp lệ C
Giá trị |
Ý nghĩa |
|
0 |
Không nén. Dữ liệu ảnh được lưu trữ trong định dạng xen kẽ thành phần, mã hóa ở độ sâu bit theo quy định của trường BPC. Giá trị này chỉ được phép cho các dòng mã nơi mà tất cả các thành phần được mã hóa ở cùng độ sâu bit. Khi độ sâu bit của mỗi thành phần không phải là một bội số của 8, giá trị thành phần sẽ được đóng gói thành byte để không bit là không sử dụng giữa các thành phần. Tuy nhiên, giá trị của các thành phần đầu tiên của mỗi mẫu sẽ bắt đầu trên một ranh giới byte và bit đệm có giá trị bằng không sẽ được chèn vào sau khi các thành phần cuối cùng của mẫu cần thiết để điền vào các bit còn lại đến ranh giới byte tiếp theo. Khi có nhiều giá trị thành phần được đóng gói vào một byte, thành phần đầu tiên sẽ xuất hiện trong các bit quan trọng nhất của byte. Khi một thành phần lớn hơn một byte, bit quan trọng nhất của nó sẽ xuất hiện trong byte trước đó. | |
1 |
ITU-T Rec. T.4, the basic algHoặcithm known as MH (Modnếuied Huffman). Giá trị này chỉ được phép cho ảnh hai mức. | |
2 |
ITU-T Rec. T.4, commonly known as MR (Modnếuied READ). Giá trị này chỉ được phép cho ảnh hai mức. | |
3 |
CCITT Rec. T.6, commonly known as MMR (Modnếuied Modnếuied READ). Giá trị này chỉ được phép cho ảnh hai mức. | |
4 |
ITU-T Rec. T.82 | ISO/IEC 11544. Thường được biết như JBIG. Giá trị này chỉ được phép cho ảnh hai mức. | |
5 |
CCITT Rec. T.81 | ISO/IEC 10918-1 Hoặc ITU-T Rec.T.84 | ISO/IEC 10918-3.
Thường được gọi là JPEG. Dòng ảnh nén này sẽ phù hợp với các cú pháp của định dạng trao đổi dữ liệu ảnh nén như quy định trong tiêu chuẩn nói trên. Giá trị này chỉ được phép cho tông, xám hoặc màu sắc ảnh liên tục. |
|
6 |
JPEG-LS. | |
7 |
Nén JPEG 2000 (được định nghĩa bởi ISO/IEC 15444). | |
8 |
JBIG2. | |
9 |
ITU-T Rec. T.82 | ISO/IEC 11544. Thường được gọi là JBIG. Giá trị này được phép cho bất kỳ ảnh được phép theo tiêu chuẩn JBIG. | |
|
Tất cả các giá trị khác dành riêng. | |
Các giá trị (bits) |
Chính xác mẫu thành phần | |
x000 đến x010 |
0000 đến 0101 |
thành phần độ sâu bit = giá trị + 1. Từ 1 bit sâu thông qua 38 bit sâu tương ứng (tính bit dấu, nếu thích hợp) |
0xxx |
xxxx |
Thành phần là những giá trị không dấu |
1xxx |
xxxx |
Thành phần là những giá trị không dấu |
111 1 |
1111 |
Các thành phần khác nhau về độ sâu bit |
Tất cả các giá trị khác dành riêng. |
UnkC: Không xác định khoảng màu. Giá trị của trường này là giống với định nghĩa cho các định dạng tập tin JP2.
IPR: Sở hữu trí tuệ. Tham số này biểu thị hoặc tập tin JPX này chứa thông tin quyền sở hữu trí tuệ được kết hợp với dòng mã hoặc các dòng mã được mô tả bởi hướng ngược tiêu đề ảnh này. Nếu giá trị của trường này là 0, thì các dòng mã này không có thông tin quyền được kết hợp. Nếu giá trị là 1, thì các dòng mã này có thông tin quyền được kết hợp. Các giá trị khác được dự trữ.
M.11.5.2 Các Bit trên mỗi hướng ngược thành phần
Bits Per Component box
Hộp Bits Per Component xác định độ sâu bit của mỗi thành phần giải nén hoàn toàn. Điều này sẽ đại diện cho độ sâu bit của các thành phần sau khi biến đổi bất kỳ thành phần ngược hoặc mở rộng chuyển đổi phi tuyến tính đã được áp dụng. Các thành phần trong dòng mã. Cấu trúc của hộp này là giống hệt với quy định tại 1.5.3.2 trong ITU-T Rec. T.800 | ISO / IEC 15.444-1 trong các định dạng tập tin JP2. Tuy nhiên, nếu loại nén của dòng mã tương ứng với hộp Bits Per phần này không phải là JPEG 2000 hoặc nếu không phải là thành phần nhiều hoặc gia hạn phi tuyến tính được sử dụng trong các dòng mã, thì giá trị của trường này trong hộp này sẽ phù hợp tương ứng bit dữ liệu mỗi thành phần trong đặc tả định dạng dòng mã tương ứng.
Bảng M.21 – Định dạng của nội dung của hộp tiêu đề ảnh
Tên trường |
Kích thước (bits) |
Giá trị |
HEIGHT |
32 |
1-(232 – 1) |
WIDTH |
32 |
1-(232 – 1) |
NC |
16 |
1-16 384 |
BPC |
8 |
See Table M.20 |
C |
8 |
7 |
UnkC |
8 |
0-1 |
IPR |
8 |
0-1 |
M.11.6 Hướng ngược tiêu đề dòng mã (siêu khung)
Hộp Dòng mã Tiêu đề xác định thông tin tiêu đề và siêu dữ liệu cụ thể cho một dòng mã cụ thể chứa trong các tập tin JPX để tạo ra một tập hợp các kênh. Tất cả các hộp Dòng mã Tiêu đề phải được đặt ở cấp cao nhất của tập tin (không nằm trong bất kỳ superbox nào).
Cả dòng mã và hộp dòng mã Tiêu đề được đánh số riêng biệt, bắt đầu bằng 0, bởi thứ tự của chúng trong tập tin. Hộp dòng mã Tiêu đề i sẽ được áp dụng cho dòng mã thứ i. Hoặc một hộp Dòng mã Tiêu đề trong tập tin cho mỗi dòng mã, hoặc có không hộp Dòng mã Tiêu đề trong tập tin. Trong trường hợp không có hộp Dòng mã Tiêu đề, thì các thông tin tiêu đề cho tất cả các dòng mã sẽ được xem là thông tin tiêu đề mặc định chứa trong các hộp JP2 Tiêu đề.
Đối với các dòng mã, việc đánh số sẽ xem xét cả hộp Contiguous dòng mã và hộp Fragment Table. Ví dụ, nếu một tập tin có chứa 2 hộp Contiguous Dòng mã, tiếp theo là một hộp Fragment Table, tiếp theo là một hộp Contiguous Dòng mã , các tập tin JPX chứa 4 dòng mã, trong đó dòng mã chứa trực tiếp trong hai hộp Contiguous Dòng mã đầu tiên được đánh số 0 và 1 , các dòng mã trỏ đến bởi hộp Fragment Table được đánh số 2, và dòng mã chứa trong hộp Contiguous Dòng mã cuối cùng là số 3.
Các loại hộp Dòng mã Tiêu đề sẽ là ‘jpch’ (Ox6A70 6368). Nội dung của một hộp Dòng mã Tiêu đề là như sau:
Hình M.13 – Tổ chức nội dung của một hộp tiêu đề dòng mã
label: hộp Label. Hộp này quy định một nhãn cho dòng mã này. Cấu trúc của nó được quy định tại M.11.13.
ihdr: hộp tiêu đề Ảnh. Hộp này xác định thông tin về dòng mã này, chẳng hạn như chiều cao và chiều rộng của nó. Cấu trúc của nó được quy định tại M.11.5.1. Nếu hộp JP2 Tiêu đề chứa một hộp Image Tiêu đề mà xác định chính xác dòng mã này, thì nó không yêu cầu hộp Dòng mã tiêu đề này chứa một hộp Image Tiêu đề. Nếu không, hộp Dòng mã tiêu đề này sẽ chứa một hộp Image Tiêu đề. Ngoài ra, nếu lá cờ sở hữu trí tuệ trong hướng ngược ảnh tiêu đề được thiết lập là 0, cho thấy không có thông tin sở hữu trí tuệ được quy định cho dòng mã này, sau đó hộp Dòng mã Tiêu đề này không được chứa một hộp sở hữu trí tuệ, và bộ đọc sẽ không áp dụng các nội dung của một hộp sở hữu trí tuệ ở cấp cao nhất của tập tin cho dòng mã này.
Hộp Bits Per Component. Hộp này quy định độ sâu bit của mỗi thành phần trong dòng mã sau khi giải nén. Cấu trúc của nó được quy định tại M.11.5.2.
pclr: hộp Palette. Hộp này định nghĩa bảng sử dụng để tạo ra nhiều thành phần từ một thành phần duy nhất. Cấu trúc của nó được quy định tại I.5.3.4 trong ITU-T Rec. T.800 | ISO / lEC 15.444-1 của các định dạng tập tin JP2.
CMAP: Hộp Component Mapping. Hộp này định nghĩa cách các kênh ảnh được xác định từ các thành phần thực tế trong dòng mã. Cấu trúc của nó được quy định tại |.5.3.5 trong ITU-T Rec. T.800 | ISO / IEC 15.444-1 của các định dạng tập tin JP2.
roid: Hộp miêu tả ROI. Hộp này miêu tả các khu vực quan tâm trong dòng mã này. Những ROIs có thể có hoặc có thể không được liên kết trực tiếp với ROIs được mã hóa trong dòng mã. Cấu trúc của nó được định nghĩa trong M.11.16.
Hộp Dòng mã Tiêu đề cũng có thể chứa các hộp dữ liệu khác, bao gồm một hộp sở hữu trí tuệ, hoặc tham khảo chéo với các hộp khác. Nếu dòng mã Tiêu đề chứa một tham chiếu chéo, thì hộp được trỏ đến bởi tham chiếu chéo được coi là lưu trữ vật lý trong hộp Dòng mã tiêu đề này.
Ngoài ra, nếu bất kỳ của các hộp được chứa trong các hộp tiêu đề JP2 và không được chứa trong hộp dòng mã tiêu đề này, thì những hộp cũng nên được áp dụng cho dòng mã này.
M.11.7 Hướng ngược tiêu đề lớp ghép hợp (siêu khung)
Hộp Hợp lại Layer Tiêu đề xác định tiêu đề và siêu dữ liệu thông tin cụ thể cho một lớp ghép cụ thể trong các tập tin JPX. Lớp ghép được đánh số, bắt đầu từ 0, theo thứ tự trong tập tin của hộp tiêu đề Hợp lại Layer (hộp thứ i xác định thông tin tiêu đề cho hợp lớp i). Sẽ có một hộp Hợp lại Layer Tiêu đề trong tập tin cho mỗi lớp. Tất cả các hộp Hợp lại Layer Tiêu đề được bố trí ở cấp cao nhất của tập tin (không nằm trong bất kỳ superbox).
Các loại hộp Hợp lại Layer Tiêu đề sẽ là ‘jplh’ (0x6A70 6C68). Nội dung của một hộp Hợp lại Layer Tiêu đề như sau:
Hình M.14 – Tổ chức nội dung của một hộp tiêu đề lớp tổ hợp
label: hộp Label. Hộp này quy định một nhãn cho lớp ghép, cấu trúc của nó được quy định tại M.11.13.
cgrp: hộp nhóm màu. Hộp này có chứa các đặc tả khoảng màu đầy đủ (đại diện bởi một chuỗi các hộp đặc tả màu sắc) cho lớp ghép này. Cấu trúc của nó được quy định tại M.11.7.1. Nếu không có hộp này thì không có một tham chiếu chéo tới một hộp Nhóm màu khác được tìm thấy trong hộp Hợp lại Layer Tiêu đề, thì giá trị mặc định của các đặc tả khoảng màu cho lớp ghép này sẽ là tập hợp của hộp Đặc tính màu cụ thể được tìm thấy trong hộp JP2 Tiêu đề. Những hộp Đặc tính màu sẽ không được đóng gói trong một hộp Nhóm màu.
opct: hộp Opacity. Hộp này quy định rằng lớp ghép sử dụng một chế độ opacity đơn giản, cấu trúc của nó được quy định tại M.11.7.6. Nếu hộp Hợp lại Layer Tiêu đề chứa một hộp Opacity, thì nó không phải có một hộp Definition Channel, và bất kỳ hộp Channel Definition trong hộp JP2 tiêu đề sẽ được bỏ qua cho lớp ghép này.
cdef: hộp Channel Definition. Hộp này định nghĩa các kênh trong ảnh. Cấu trúc của nó được quy định tại I.5.3.6 trong ITU-T Rec. T.800 | ISO / IEC 15.444-1 của các định dạng tập tin JP2. Hộp này không được tìm thấy nếu hộp Hợp lại Layer Tiêu đề có chứa một hộp Opacity, creg: hộp đăng ký Dòng mã. Hộp này quy định việc đăng ký không gian giữa các dòng mã trong lớp ghép. Cấu trúc của nó được quy định tại M.11.7.7. Nếu bất kỳ hộp Hợp lại Layer Tiêu đề chứa một hộp Dòng mã Registration, thì mỗi hộp Hợp lại Layer Tiêu đề phải có một hộp Dòng mã Registration.
res: hộp Resolution. Hộp này quy định việc bắt giữ và hiển thị mặc định độ phân giải của ảnh. Cấu trúc của nó được quy định tại I.5.3.7 trong ITU-T Rec. T.800 | ISO / IEC 15.444-1 của các định dạng tập tin JP2.
Hộp tiêu đề Hợp lại lớp cũng có thể chứa các hộp dữ liệu khác, bao gồm một hộp sở hữu trí tuệ, hoặc tham khảo chéo với các hộp khác. Nếu Hợp lại lớp Tiêu đề chứa một tham chiếu chéo, sau đó hộp được trỏ đến bởi tham chiếu chéo được coi là nếu nó đã được thể chất lưu trữ trong hộp Hợp lại lớp tiêu đề này.
Ngoài ra, nếu bất kỳ của các hộp được chứa trong các hộp tiêu đề JP2 và không được chứa trong hộp lớp tiêu đề Hợp lại này, sau đó những hộp cũng nên được áp dụng cho lớp ghép này.
M.11.7.1 Hướng ngược nhóm màu (siêu khung)
Một hộp nhóm màu có chứa một bộ có liên quan, tương đương, phương pháp đặc tả màu sắc. Khi giải thích khoảng màu của một dòng mã, bất kỳ phương pháp đặc tả màu chứa trong các quy định hộp Nhóm màu có thể được sử dụng. Hộp này chỉ được tìm thấy trong một hộp Hợp lại Layer Tiêu đề. Đóng gói này làm giảm phí tổn lưu trữ chia sẻ toàn bộ một tập hợp các đặc tả màu sắc giữa các lớp.
Một hộp nhóm màu (hoặc hộp JP2 Tiêu đề) không được chứa nhiều hộp Đặc tính màu s với một giá trị METH của 1 (phương pháp liệt kê), hoặc nhiều hộp với một giá trị METH là 2 (phương pháp ICC hạn chế). Một nhóm màu duy nhất có thể chứa nhiều hộp đặc tính màu với giá trị METH là 3 (phương pháp ICC Bất kỳ) hoặc 4 (phương pháp màu nhà cung cấp). Nhiều hồ sơ ICC (của nhiều loại không hạn chế) có thể được sử dụng để xác định một khoảng màu cụ thể với mức độ khác nhau của sự phức tạp (1D LUT vs 3D LUT), và nhiều phương pháp Vend hoặc Colour có thể được sử dụng để chỉ định nhiều đại diện không ICC của khoảng màu.
Các tập tin JPX có thể không chứa hộp Nhóm màu, mà chỉ ra rằng tất cả các lớp ghép lại trong khoảng màu quy định trong hộp tiêu để JP2 (thông qua một tập hợp các hộp Đặc tính màu lưu trữ trực tiếp trong hộp JP2 Tiêu đề và không được đóng gói trong một hộp Nhóm màu ).
Tuy nhiên, nếu các tập tin không chứa một tả khoảng màu trong hộp JP2 Tiêu đề (hoặc không chứa hộp JP2 Tiêu đề), thì các tập tin JPX phải chứa ít nhất một hộp Nhóm màu . Các loại hộp nhóm màu sẽ là ‘cgrp’ (0x6367 7270). Nội dung của một hộp Nhóm màu như sau:
Hình M.15 – Tổ chức nội dung của một hộp nhóm màu
CLRi: Hộp đặc tả màu. Hộp Đặc tính màu này quy định một phương pháp mà khoảng màu của một dòng mã cụ thể có thể được giải thích. Định dạng của hộp đặc tính màu được quy định tại M.11.7.2
M.11.7.2 Hướng ngược đặc tính màu
Mỗi hộp đặc tính màu định nghĩa một phương pháp ứng dụng có thể giải thích khoảng màu của dữ liệu ảnh giải nén. Đặc tả màu này sẽ được áp dụng cho các dữ liệu ảnh sau khi đã được giải nén và sau khi chuyển đổi bất kỳ thành phần ngược lại và chuyển đổi phi tuyến tính đảo ngược đã được áp dụng cho các dữ liệu ảnh giải nén.
Hộp đặc tính màu có thể được tìm thấy trong một trong hai hộp JP2 Tiêu đề hoặc trong hộp Nhóm màu. Tổng cộng, một tập tin JPX có thể chứa nhiều hộp đặc tính màu, và hoặc trong hộp JP2 Tiêu đề hoặc hộp nhóm màu cụ thể có thể chứa nhiều hộp đặc tính màu. Tuy nhiên, tất cả các file JPX phải chứa ít nhất một hộp đặc tính màu.
Các loại hộp và cấu trúc nhị phân của một hộp đặc tính màu giống hệt với quy định trong định dạng tập tin JP2. Tuy nhiên, để làm rõ sự mở rộng của các hộp đối với việc xác định phương pháp đặc tả màu mới, cách thức mà nó được mô tả là thay đổi JPX. Nội dung của một hộp Đặc tính màu như sau:
Hình M.16 – Tổ chức nội dung của một hộp đặc điểm kỹ thuật màu
METH: phương pháp kỹ thuật. Trường này quy định các phương pháp được sử dụng bởi hộp Đặc tính màu để xác định khoảng màu của ảnh giải nén. Trường này được mã hóa như một số nguyên không dấu 1-byte. Các giá trị hợp lệ của trường METH như sau:
Bảng M.22- Giá trị hợp lệ METH
Giá trị |
Ý nghĩa |
1 |
Phương pháp liệt kê. Hộp đặc tính màu này chỉ ra rằng không gian màu của dòng mã được xác định bởi một mã số nguyên liệt kê. Định nghĩa của định dạng của phương pháp này giống với phương pháp được liệt kê trong JP2. Tuy nhiên, các định dạng tập tin JPX xác định giá trị liệt kê thêm theo quy định tại M.11.7.3.1, cũng như các thông số bổ sung cho một số không gian màu liệt kê theo quy định tại M.11.7.4. |
2 |
Phương pháp ICC hạn chế. Hộp đặc tính màu này chỉ ra rằng không gian màu của dòng mã được xác định bởi một hồ sơ ICC nhúng các loại bị hạn chế. Định nghĩa và định dạng của phương pháp này giống với phương pháp ICC hạn chế được định nghĩa trong tập tin định dạng JP2, I.5.3.3 trong ITU-T Rec. T.800 | ISO / IEC 15.444- 1. |
3 |
Phương pháp ICC bất kỳ. Hộp đặc tính màu này chỉ ra rằng không gian màu của dòng mã được xác định bởi một hồ sơ ICC nhúng đầu vào. Trái ngược với phương pháp ICC hạn chế được định nghĩa trong tập tin định dạng JP2, phương pháp này cho phép bất kỳ hồ sơ ICC đầu vào, được định nghĩa bởi ICC-1. Các định dạng nhị phân của trường METHDAT được quy định tại M.11.7.3.2. |
4 |
Phương pháp Màu nhà cung cấp. Hộp đặc tính màu này chỉ ra rằng không gian màu của dòng mã được xác định bởi một nhà cung cấp duy nhất đang được xác định. Các định dạng nhị phân của trường METHDAT được quy định tại M.11.7.3.3. Tất cả các giá trị khác dành riêng. Đối với bất kỳ giá trị của trường meth, chiều dài của trường METHDAT có thể không được 0, và các ứng dụng không phải hy vọng rằng trường xấp xỉ là trường cuối cùng trong hộp nếu giá trị của trường meth không hiểu. Trong trường hợp này, một độc giả phù hợp sẽ bỏ qua toàn bộ trọng hộp đặc tính màu. |
PREC: Quyền ưu tiên. Trường này quy định các quyền ưu tiên của hộp Đặc tính màu này, đối với các hộp Đặc tính màu khác trong cùng một hộp Nhóm màu, hoặc hộp JP2 Tiêu đề nếu Đặc tính màu này là trong hộp JP2 Tiêu đề. Đó là đề nghị, nhưng không bắt buộc, mà bộ đọc phù hợp sử dụng phương pháp đặc tả màu được hỗ trợ quyền ưu tiên cao nhất. Trường này được quy định như một số nguyên ký 1-byte.
APPROX: Khoảng màu. Trường này quy định cụ thể mức độ mà phương pháp này đặc tả màu gần giống với định nghĩa “chính xác” của khoảng màu. Một ví dụ về xấp xỉ của một đặc tả có thể tăng lượng tử trong các bảng look-up hoặc làm tròn hệ số ma trận. Trường này được quy định như số nguyên không dấu 1-byte. Giá trị hợp lệ của Trường này như sau:
Trái ngược với các trường APPROX trong tập tin JP2 (một tập tin với “jp2 \ 040” trong trường BR trong hộp File Type), giá trị 0 trong trường APPROX là bất hợp pháp trong một tập tin JPX (một tập tin với “jpx \ 040” trong trường BR trong hộp File Type). Bộ ghi JPX được yêu cầu phải chỉ ra đúng mức độ xấp xỉ của đặc tả màu để định nghĩa chính xác khoảng màu. Điều này không chỉ định nếu các bộ ghi của tập tin biết khoảng màu thực tế của dữ liệu ảnh. Nếu khoảng màu thực tế không rõ, thì giá trị của trường UnkC trong hộp Image tiêu đề được thiết lập là 1 và các trường APPROX sẽ quy định cụ thể mức độ mà hộp Đặc tính màu này phù hợp với định nghĩa chính xác của khoảng màu giả định hay khoảng màu đích.
Ngoài ra, giá trị cao của trường APPROX (chỉ xấp xỉ nghèo) sẽ không được sử dụng để che giấu rằng nhiều hộp Đặc tính màu trong hoặc một hộp Nhóm màu hoặc hộp JP2 Tiêu đề thực sự đại diện các khoảng màu khác nhau; các đặc điểm kỹ thuật của nhiều khoảng màu khác nhau trong một hộp Nhóm màu duy nhất là bất hợp pháp.
Bảng M.23 – Giá trị hợp lệ xấp xỉ
Giá trị |
Ý nghĩa |
1 |
Phương pháp đặc tính màu này đại diện cho định nghĩa chính xác của không gian màu |
2 |
Phương pháp đặc tính màu này xấp xỉ định nghĩa chính xác của không gian màu với chất lượng vượt trội |
3 |
Phương pháp đặc tính màu này xấp xỉ định nghĩa chính xác của không gian màu với chất lượng hợp lý |
4 |
Phương pháp đặc tính màu này xấp xỉ định nghĩa chính xác của không gian màu với chất lượng kém. |
|
Tất cả các giá trị được dành riêng |
Bảng M.24 – Định dạng của nội dung của hướng ngược đặc điểm kỹ thuật màu
Tên trường |
Kích thước (bits) |
Giá trị |
METH |
8 |
1-4 |
PREC |
8 |
-128-127 |
APPROX |
8 |
1-4 |
METHDAT |
Biến đổi |
Biến đổi |
M.11.7.3 Các đặc tính trường METHDAT trong hướng ngược đặc tính màu
Các mục nhỏ sau đây xác định các trường và các giá trị tạo nên trường METHDAT cho từng phương pháp xác định đặc tả màu.
M.11.7.3.1 Các giá trị METHDAT cho phương pháp đã liệt kê
Nội dung của trường METHDAT cho các hộp Đặc tính màu bằng cách sử dụng phương pháp liệt kê được định nghĩa như sau:
Hình M.17- Tổ chức nội dung của trường METHDAT đối với phương pháp Enumerated
EnumCS: Khoảng màu được liệt kê. Trường này quy định các khoảng màu của ảnh bằng cách sử dụng một mã số nguyên. Để giải thích một cách chính xác màu sắc của ảnh bằng cách sử dụng một khoảng màu được liệt kê, ứng dụng phải biết định nghĩa của khoảng màu nội bộ. Trường này có giá trị số nguyên không dấu big endian 4-byte cho thấy khoảng màu của ảnh. Giá trị EnumCS hợp lệ là những giá trị được xác định cho các phương pháp được liệt kê trong các định dạng tập tin JP2 và các giá trị được xác định như sau (Bảng M.25).
Bảng M.25- Thêm giá trị hợp lệ EnumCS
Giá trị |
Ý nghĩa |
0 |
Bi-level: Giá trị này sẽ được dùng để chỉ ảnh hai mức. Mỗi mẫu ảnh là một bit: 0 = màu trắng, 1 = black. |
1 |
YCbCr(1): Đây là một định dạng thường được sử dụng cho dữ liệu có nguồn gốc từ một tín hiệu video. Các không gian màu dựa trên ITU R Rec. BT.709-4. Phạm vi hợp lệ của các thành phần YCbCr trong không gian này được giới hạn ít hơn so với phạm vi đầy đủ mà có thể được đại diện cho một đại diện 8-bit. ITU-R Rec. BT.601-5 xác định các phạm vi này cũng như định nghĩa một ma trận biến đổi 3 x 3 có thể được sử dụng để chuyển đổi các mẫu vào RGB. |
3 |
YCbCr(2): Đây là định dạng phổ biến nhất được sử dụng cho dữ liệu ảnh mà ban đầu được chụp trong RGB (định dạng chưa được hiệu chỉnh). Các không gian màu dựa trên ITU-R Rec. BT.601-5. Phạm vi hợp lệ của thành phần YCbCr trong không gian này là [0, 255] cho Y, và [-128, 127] cho Cb và Cr (lưu trữ có độ lệch 128 để chuyển đổi phạm vi để [0, 255]). Những phạm vi là khác nhau từ những người quy định tại ITU-R Rec. BT.601-5. ITU-R Rec. BT.601-5 xác định một ma trận biến đổi 3 X 3 có thể được sử dụng để chuyển đổi các mẫu vào RGB. |
4 |
YCbCr(3): Đây là một định dạng thường được sử dụng cho dữ liệu có nguồn gốc từ một tín hiệu video. Các colourspace dựa trên ITU-R Rec. BT.601-5. Phạm vi hợp lệ của thành phần YCbCr trong không gian này được giới hạn ít hơn so với phạm vi đầy đủ mà có thể được đại diện cho một đại diện 8-bit. ITU-R Rec. BT.601-5 xác định các phạm vi này cũng như định nghĩa một ma trận biến đổi 3 x 3 có thể được sử dụng để chuyển đổi các mẫu vào RGB. |
9 |
PhotoYCC: Đây là phương pháp mã hóa màu sắc được sử dụng trong các hệ thống ảnh CD™, Các colourspace dựa trên ITU-R Rec. Sơ tài liệu tham khảo BT.709. ITU-R Rec. Tín hiệu ảnh BT.709 tuyến tính RGB được chuyển thành giá trị R’G’B ‘phi tuyến tính để YCC tương ứng với ITU-R Rec. BT.601-5. Chi tiết về các phương pháp mã hóa này có thể được tìm thấy trong các sản phẩm Kodak Photo CD, A Planning Guide f Hoặc Developers, Eastman Kodak Comp bất kỳ, Part No. DC1200R và cũng trong Kodak Photo CD Inf Hoặc mation Bulletin PCD045. |
11 |
CMY: Các dữ liệu được mã hóa bao gồm các mẫu Cyan, Magenta và mẫu vàng, trực tiếp thích hợp để in trên các thiết bị CMY điển hình. Giá trị 0 phải chỉ 0% chi phí thanh mực, trong khi một giá trị của 2BPS_1 phải nêu rõ phạm vi mực 100% cho một mẫu thành phần cho trước. |
12 |
CMYK: Như CMY trên, ngoại trừ rằng đó cũng là một màu đen (K) thành phần mực. Bảo hiểm mực được định nghĩa như trên. |
13 |
YCCK: Đây là kết quả của việc chuyển đổi dữ liệu kiểu CMYK ban đầu bằng cách tính toán R = (2BPB-1)-C, G = (2BPS-1)-M, và B = (2BPS-1)-Y, áp dụng các RGB để YCC chuyển đổi quy định cho YCbCr (2) ở trên, và sau đó tái kết hợp các kết quả với K-không chỉnh sửa mẫu. Sự chuyển đổi này có thể dùng để tương tự như quy định tại Adobe Postscript. |
14 |
CIELab: Không gian màu CIE 1976 (L*a*b*). Một colourspace quy định của CIE (Commission Internationale de I‘ECLAIRAGE), có xấp xỉ bằng sự khác biệt nhìn thấy được giữa các điểm cách đều nhau trên khắp không gian. Ba thành phần là L*, hoặc độ sáng, và a* và b* trong màu. Đối với không gian màu này, các thông số được liệt kê bổ sung được quy định trong lĩnh vực bảo vệ môi trường theo quy định tại M.11.7.4.1 |
15 |
Bi-level(2): Giá trị này sẽ được dùng để chỉ ảnh hai mức. Mỗi mẫu là ảnh một chút: 1 = màu trắng, 0 = black. |
18 |
sYCC theo quy định của IEC 61966-2-1, Amd.1.
Chú ý: – Nó không được khuyến cáo sử dụng công nghệ thông tin hoặc RCT quy định tại ITU-T Rec. T.800 | ISO / IEC 15.444-1 Phụ lục G với dữ liệu ảnh sYCC. Xem ITU-T Rec. T.800 | ISO / IEC 15.444-1, J.15, để được hướng dẫn về xử lý dòng mã YCC. |
19 |
CIEJab: Theo định nghĩa của CIE mẫu xuất hiện màu sắc 97s, CIE Xuất bản 131. Đối với không gian màu này, các thông số được liệt kê bổ sung được quy định trong lĩnh vực bảo vệ môi trường theo quy định tại M.11.7.4.2. |
20 |
e-sRGB: được định nghĩa bởi PIMA 7667. |
21 |
ROMM-RGB: được định nghĩa bởi PIMA 7666. |
22 |
YPbPr(1125/60): Đây là không gian màu sắc và giá trị nổi tiếng định nghĩa cho HDTV (1125/60/2: 1) hệ thống sản xuất và trao đổi chương trình quốc tế theo quy định của ITU-R Rec. BT.709-3. Khuyến nghị xác định màu sắc ma trận chuyển đổi không gian từ RGB để YPbPr (1125-1160) và phạm vi của các giá trị của mỗi thành phần. Ma trận là khác nhau từ hệ thống 1250-1250. Trong 8-bit / trường hợp thành phần, phạm vi của các giá trị của mỗi thành phần là [1, 254], mức độ đen của Y là 16, mức tiêu sắc của Pb / Pr là 128, đỉnh của Y là 235, và những thái cực danh nghĩa của Pb / Pr là 16 và 240. trong trường hợp 10-bit, các giá trị được định nghĩa một cách tương tự. |
23 |
YPbPr(1250/50): Đây là không gian màu sắc và giá trị nổi tiếng định nghĩa cho HDTV (1250/50/2: 1) hệ thống sản xuất và trao đổi chương trình quốc tế theo quy định của ITU-R Rec. BT.709-3. Khuyến nghị xác định màu sắc ma trận chuyển đổi không gian từ RGB để YPbPr (1250-1250) và phạm vi của các giá trị của mỗi thành phần. Ma trận là khác nhau từ hệ thống 1125-1160. Trong 8-bit / trường hợp thành phần, phạm vi của các giá trị của mỗi thành phần là [1, 254], mức độ đen của Y là 16, mức tiêu sắc của Pb / Pr là 128, đỉnh của Y là 235, và những thái cực danh nghĩa của Pb / Pr là 16 và 240. trong trường hợp 10-bit, các giá trị được định nghĩa một cách tương tự. |
24 |
e-sYCC: e-sRGB dựa trên không gian màu YCC theo quy định của Pima 7667 Phụ lục B. |
|
Tất cả các giá trị dành riêng |
RGB và khoảng màu xám từ các định dạng tập tin SPNẾUF rõ ràng không được bao gồm. Ứng dụng có nhu cầu chuyển mã ảnh SPNẾUF sử dụng khoảng màu 8 và 10 nên xác định, trong tập tin JPX, định nghĩa khoảng màu mà một bộ đọc sẽ sử dụng để giải thích một cách rõ ràng các dữ liệu ảnh. Trong nhiều trường hợp, điều này sẽ là khoảng màu sRGB hoặc sRGB-xám từ JP2. Ngoài ra, bộ ghi tập tin cần thiết lập các trường UnkC trong hộp Image Tiêu đề chỉ ra rằng khoảng màu thực tế không được biết.
EP: các thông số liệt kê. Trường này có chứa một loạt các thông số làm tăng thêm định nghĩa khoảng màu chung theo quy định của EnumCS. Cùng với nhau, EnumCS và các trường EP mô tả khoảng màu và cách mã hóa dữ liệu màu sắc các tập tin JPX. Ví dụ, khoảng màu CIELAB như mô tả của ITU-T Rec. T.42 đòi hỏi một vài thông số để mô tả mã hóa ITU các dữ liệu màu sắc. Các định dạng và giá trị của trường EP được xác định riêng cho mỗi EnumCS theo yêu cầu. Nếu một giá trị của EP không được định nghĩa cho một giá trị cụ thể của EnumCS, thì chiều dài trường EP cho rằng giá trị EnumCS sẽ là 0, cho thấy giá trị EnumCS một mình mô tả các khoảng màu hoặc mặc định giá trị này được sử dụng theo quy định của định nghĩa khoảng màu tham chiếu. Các định dạng và giá trị của trường EP được quy định tại M.11.7.4. Tuy nhiên, trường EP sẽ là trường cuối cùng trong hộp Đặc tính màu và sẽ được tất cả các byte tiếp theo trường EnumCS đến cuối của hộp.
Bảng M.26 – Định dạng của nội dung của trường METHDAT phương pháp Enumerated
Tên trường |
Kích thước (bits) |
Giá trị |
EnumCS |
32 |
0-(232-1) |
EP |
Biến đổi |
Biến đổi |
M.11.7.3.2 Các giá trị METHDAT cho phương pháp ICC bất kỳ
Các nội dung của trường METHDAT đối với các hướng ngược đã tính màu sử dụng phương pháp ICC bất kỳ được định nghĩa như sau:
Hình M.18 – Tổ chức nội dung của trường METHDAT đối với phương pháp ICC bất kỳ
Profile: Thông tin ICC. Trường này chứa một thông tin đầu vào ICC theo quy định của ICC-1, quy định cụ thể việc chuyển đổi giữa các giá trị mã giải nén và PCS. Bất kỳ thông tin ICC đầu vào, bất kể thông tin nào, có thể được chứa trong trường này.
Bảng M.27- Định dạng của nội dung của trường METHDAT đối với phương pháp bất kỳ ICC
Tên trường |
Kích thước (bits) |
Giá trị |
PROFILE |
Biến đổi |
Biến đổi |
M.11.7.3.3 Các giá trị METHDAT cho phương pháp màu nhà cung cấp
Nội dung của trường METHDAT cho các hộp Đặc tính màu bằng cách sử dụng phương pháp VendHoặc Colour được quy định như sau:
Hình M.19- Tổ chức nội dung của trường METHDAT đối với phương pháp màu nhà cung cấp
VCLR: Mã xác định nhà cung cấp. Trường này quy định các khoảng của ảnh bằng cách sử dụng một UUID. Để giải thích một cách chính xác màu sắc của ảnh bằng cách sử dụng một khoảng màu đã xác định nhà cung cấp, ứng dụng phải biết định nghĩa của khoảng màu nội bộ. Trường này có một UUID 16-byte cho biết khoảng màu của ảnh. Những giá trị này được xác định và được chia sẻ bởi các nhà cung cấp cá nhân và nằm ngoài phạm vi của Tiêu chuẩn này này.
VP: tham số nhà cung cấp. Trường này quy định một loạt các tham số làm tăng thêm định nghĩa; khoảng màu chung theo quy định của VCLR. Cùng với nhau, các trường VCLR và VP rõ ràng mô tả khoảng màu. Các định dạng và giá trị của trường VP được xác định riêng cho mỗi giá trị VCLR khi cần thiết. Nếu một giá trị của VP không được định nghĩa cho một giá trị cụ thể của VCLR, thì chiều dài của trường VP cho rằng giá trị VCLR sẽ là 0, cho thấy giá trị VCLR duy nhất một cách rõ ràng mô tả khoảng màu, hoặc giá trị mặc định được sử dụng theo quy định của định nghĩa khoảng màu tham chiếu. Các định dạng và giá trị của các trường VP được xác định bởi mỗi định nghĩa của nhà cung cấp khoảng màu cá nhân, và nằm ngoài phạm vi của Tiêu chuẩn này này. Tuy nhiên, trường VP sẽ là trường cuối cùng trong hộp Đặc tính màu và sẽ được tất cả các byte trong hướng ngược bên dưới, tiếp theo trưởng VCLR đến cuối của hộp.
Bảng M.28 – Định dạng của nội dung của trường METHDAT đối với phương pháp màu nhà cung cấp
Tên trường |
Kích thước (bits) |
Giá trị |
VCLR |
128 |
Biến đổi |
VP |
Biến đổi |
Biến đổi |
M.11.7.4 Định dạng và các giá trị trường EP
Trường này xác định định dạng và giá trị của các trường EP cho các Đặc tính màu bằng cách sử dụng phương pháp liệt kê. Nếu một trường EP không được định nghĩa cho một giá trị cụ thể của trường EnumCS, thì chiều dài của trường EP sẽ là 0.
M.11.7.4.1 Định dạng trường EP cho khoảng màu CIELAB
Nếu giá trị của EnumCS là 14, chỉ ra rằng các lớp được mã hóa trong khoảng màu CIELAB, thì định dạng của các trường EP được quy định như sau:
Hình M.20 – Tổ chức nội dung của trường EP đối với CIELab (EnumCS = 14)
Các trường RL, CV, RA, OA, RB và OB mô tả cách chuyển đổi giữa các giá trị không dấu NL, Na, Nb, như được định nghĩa bởi ITU-T Rec. T.42, được gửi đến các máy nén hoặc nhận được giải nén và các giá trị CIELAB ký kết L *, a *, b * theo quy định của CIE. Theo ITU-T Rec. T.42, các tính toán từ giá trị thực L * a * b * tới số nguyên bit nLnanb, được trình bày bởi NLNaNb, được thực hiện như sau:
(M-18)
Các trường IL xác định dữ liệu Giá Trị sử dụng trong việc tính toán giá trị CIELAB.
RL: Phạm vi cho L *. Trường này quy định các giá trị RL từ phương trình M-18. Nó được mã hóa như một số nguyên không dấu big endian 4-byte.
CV: Offset cho L *. Trường này quy định các giá trị văn từ phương trình M-18. Nó được mã hóa như một số nguyên không dấu big endian 4-byte.
RA: Phạm vi cho một *. Trường này quy định các giá trị RA từ phương trình M-18. Nó được mã hóa như một số nguyên không dấu big endian 4-byte.
OA: Offset cho một a*. Trường này quy định các giá trị viêm khớp từ phương trình M-18. Nó được mã hóa như một số nguyên không dấu big endian 4-byte.
RB: Phạm vi cho b *. Trường này quy định các giá trị RB từ phương trình M-18. Nó được mã hóa như một số nguyên không dấu big endian 4-byte.
OB: độ lệch b *. Trường này quy định các giá trị OB từ phương trình M-18. Nó được mã hóa như một số nguyên không dấu big endian 4-byte.
IL: soi sáng. Trường này quy định các dữ liệu mở đường sử dụng trong việc tính toán giá trị CIELAB. Thay vì chỉ định các giá trị XYZ của bình thường, được sử dụng trong việc tính toán CIELAB, các đặc tả của dữ liệu mở đường theo ITU-T Rec. T.4 Phụ lục E. Các dữ liệu mở đường bao gồm 4 byte, xác định mở đường. Trong trường hợp của một trường tiêu chuẩn, 4 byte là một trong những giá trị sau đây:
Bảng M.29- Giá trị độ sáng chuẩn đối với CIELab
Giá Trị |
Trường IL tiêu chuẩn |
CIE Giá Trị D50 |
0x0044 3530 |
CIE Giá Trị D65 |
0x0044 3635 |
CIE Giá Trị D75 |
0x0044 3735 |
CIE Giá Trị SA |
0x0000 5341 |
CIE Giá Trị sc |
0x0000 5343 |
CIE Giá Trị F2 |
0x0000 4632 |
CIE Giá Trị F7 |
0x0000 4637 |
CIE Giá Trị F11 |
0x0046 3131 |
Khi Giá Trị được xác định bởi một nhiệt độ màu, thì 4 byte bao gồm chuỗi ‘CT’, tiếp theo là hai byte không dấu đại diện cho nhiệt độ của Giá Trị bằng độ Kelvin là một số nguyên unsigned 2-byte big endian. Ví dụ, một Giá Trị 7500K được đại diện bởi 4 byte 0x4354 1D4C.
Khi các trường EP bị bỏ qua cho khoảng màu CIELAB, thì các giá trị mặc định tiếp theo sẽ được sử dụng. Các tham số phạm vi L *, a * và b * Mặc định là 100, 170 và 200. Giá trị offset L *, a * và b * mặc định là 0, 2^(Na-1) VÀ 2^(Nb,-2) + 2^(Nb-3). Những mặc định tương ứng với mã hóa CIELAB trong ITU-T Rec. T.42. Giá trị mặc định của trường IL là 0x0044 3530, xác định CIE Giá Trị D50.
Các ứng dụng khác có thể sử dụng các giá trị phạm vi khác bằng cách xác định giá trị trường EP. Ví dụ, mã hóa CIELAB trong ICC Profile FHoặcmat Specnếuication, ICC.1: 2001-11 quy định cụ thể phạm vi và offsets cho mã hóa CIELAB đó là khác nhau hơn so với mặc định đưa ra ở đây. Nếu các giá trị quy định trong bảng mã CIELAB trong ICC Profile FHoặcmat Specnếuication, ICC.1: 2001-11, được sử dụng, thì chúng sẽ phải được đưa ra một cách rõ ràng trong các trường EP.
Bảng M.30 – Định dạng của nội dung của trường EP đối với CIELab (EnumCS = 14)
Tên trường |
Kích thước (bits) |
Giá trị |
RL |
32 |
0-(232-1) |
OL |
32 |
0-(232-1) |
RA |
32 |
0-(232-1) |
OA |
32 |
0-(232-1) |
RB |
32 |
0-(232–1) |
OB |
32 |
0-(232–1) |
IL |
32 |
Biến đổi |
M.11.7.4.2 Định dạng trường EP cho khoảng màu CIEJab
Nếu giá trị của EnumCS là 19, xác định rằng các lớp được mã hóa trong khoảng màu CIEJab, thì định dạng của các trường EP được quy định như sau:
Hình M.21- Tổ chức nội dung của trường EP đối với CIEJab (EnumCS = 19)
Các trường này mô tả cách chuyển đổi giữa các giá trị không dấu NJ, Na, Nb, như được định nghĩa bởi CIE Publication số. 131, được gửi đến các máy nén hoặc nhận được giải nén và các giá trị CIEJAB ký kết J, a, b theo quy định của CIE. Theo CIE Publication số. 131, các tính toán từ giá trị thực Jab tới số nguyên bit NJNaNb, được trình bày bởi NJNaNb, được thực hiện như sau:
(M-19)
RJ: Phạm vi cho J. Trường này quy định các giá trị RJ từ phương trình M-19. Nó được mã hóa như một số nguyên khống dấu big endian 4-byte. Nếu trường EP không được xác định cho hộp Colour Specnếuication, thì giá trị 100 cho RJ được sử dụng.
OJ: Offset cho J. Trường này quy định các giá trị OJ từ phương trình M-19. Nó được mã hóa như một số nguyên không dấu big endian 4-byte. Nếu trường EP không được xác định cho hộp Colour Specnếuication, thì giá trị 0 cho OJ được sử dụng.
RA: Phạm vi cho a. Trường này quy định các giá trị RA từ phương trình M-19. Nó được mã hóa như một số nguyên không dấu big endian 4-byte. Nếu trường EP không được xác định cho hộp Colour Specnếuication, thì giá trị 255 cho RA được sử dụng.
OA: Offset cho một a. Trường này quy định các giá trị OA từ phương trình M-19. Nó được mã hóa như một số nguyên không dấu big endian 4-byte. Nếu trường EP không được xác định cho hộp Colour Specnếuication, thì giá trị 2B-1 cho OA được sử dụng, trong đó b là số bit mỗi mẫu cho kênh ‘a’.
RB: Phạm vi cho b. Trường này quy định các giá trị RB từ phương trình M-19. Nó được mã hóa như một số nguyên không dấu big endian 4-byte. Nếu trường EP không được xác định cho hộp Colour Specnếuication, thì giá trị 255 cho RB được sử dụng.
OB: offset b. Trường này quy định các giá trị OB từ phương trình M-19. Nó được mã hóa như một số nguyên không dấu big endian 4-byte. Nếu trường EP không được xác định cho hộp Colour Specnếuication, thì giá trị 2b-1 cho OB được sử dụng, , trong đó b là số bit mỗi mẫu cho kênh ‘b’.
Bảng M.31 – Định dạng nội dung của trường EP đối với CIEJab (EnumCS = 19)
Tên trường |
Kích thước (bits) |
Giá trị |
RJ |
32 |
0-(232-1) |
OJ |
32 |
0-(232-1) |
RA |
32 |
0-(232-1) |
OA |
32 |
0-(232-1) |
RB |
32 |
0-(232-1) |
OB |
32 |
0-(232-1) |
M.11.7.5 Hướng ngược xác định kênh
Các định dạng nhị phân của hộp Channel Definition giống với định nghĩa trong ITU-T Rec. T.800 | ISO / IEC 15.444-1, I.5.3.6. Tuy nhiên, trong một tập tin JPX hộp này có thể không đọc được bởi một đầu đọc JP2, hoặc một dòng mã trong một tập tin JPX đó sẽ không được đọc bởi một bộ đọc JP2, kênh bất kỳ có thể được liên kết với màu bất kỳ hoặc loại bất kỳ. Giá trị bổ sung sau đây của trường Asoci được định nghĩa:
Bảng M.32 – Các màu chỉ thị bởi trường Asoci
Lớp của không gian màu |
Màu chỉ thị bởi giá trị sau của trường Asoci |
|||
1 |
2 |
3 |
4 |
|
RGB |
R |
G |
B |
|
Greyscale |
Y |
|
|
|
XYZ |
X |
Y |
Z |
|
Lab |
L |
a |
b |
|
Luv |
L |
U |
v |
|
YCbCr |
Y |
Cb |
Cr |
|
Yxy |
Y |
x |
y |
|
HSV |
H |
S |
V |
|
HLS |
H |
L |
S |
|
CMYK |
C |
M |
Y |
K |
CMY |
C |
M |
Y |
|
Jab |
J |
a |
b |
|
n colour colourspaces |
1 |
2 |
3 |
4 |
M.11.7.6 Hướng ngược độ mờ
Hộp Opacity cung cấp một cơ chế tối thiểu để xác định độ mờ thông qua một khóa sắc độ hoặc xác định rằng một lớp ghép cụ thể chỉ chứa các kênh màu tiếp theo là một kênh opacity duy nhất. Nếu một hộp Hợp lại Layer Tiêu đề chứa một hộp Opacity, thì nó sẽ không chứa hộp Channel Definition. Lớp ghép yêu cầu một định nghĩa kênh phức tạp hơn có thể được xác định bằng cách sử dụng một hộp Opacity sẽ sử dụng một hộp kênh Definition. Mỗi hộp Hợp lại Layer Tiêu đề phải có không hoặc một hộp Opacity, và hộp Opacity được tìm thấy ở các địa điểm khác không có trong tập tin.
Độ mờ khóa sắc độ là một dạng paletization và như ảnh sử dụng độ mờ khóa sắc độ phải tuân theo các quy tắc tương tự như ảnh palettized đầy đủ đối với nén có tổn hao. Trong cả hai trường hợp, sự khác biệt giữa ảnh gốc và ảnh giải nén phản ánh sai sót trong một không gian mà không có bản đồ trực tiếp đến nhận thức trực quan, và do đó không nên được mã hóa hoặc giải nén trong một chế độ có tổn hao. Tuy nhiên, với giá trị chroma-key, trái ngược với một thành phần palettized hoàn toàn, chỉ có mẫu ảnh mà là giá trị chroma-key phải được mã hóa và giải mã không tổn hao. Mã hóa không tổn hao chung của khu vực chroma-keyed và mã hóa có tổn hao của khu vực ảnh còn lại có thể đạt được bằng cách sử dụng một ROI trong dòng mã.
Các loại hộp Opacity sẽ là ‘opct’ (0x6F70 6374). Nội dung của hộp này được thực hiện như sau:
Hình M.22 – Tổ chức của nội dung của hộp Opacity
Otyp: Loại Opacity. Trường này quy định các loại opacity được sử dụng bởi lớp ghép này. Trường này được mã hóa như một số nguyên unsigned 1-byte. Giá trị hợp lệ của trường Otyp như sau:
Bảng M.33 – Các giá trị trường Otyp
Giá trị |
Ý nghĩa |
0 |
Các kênh cuối cùng trong lớp ghép này là một kênh opacity và tất cả các kênh khác là các kênh màu sắc nơi hội kênh là bằng với số kênh 1. Ví dụ, một lớp hợp bốn kênh sẽ có 3 kênh màu (với các hiệp hội 1, 2 và 3 tương ứng) tiếp theo là một kênh opacity. Nếu giá trị của Otyp là 0, sau đó là các trường NCH, PR và CVi sẽ không được tìm thấy |
1 |
Các kênh cuối cùng trong lớp ghép này là một kênh opacity premultiplied và tất cả các kênh khác là các kênh màu sắc nơi hội kênh là bằng với số kênh 1. Ví dụ, một lớp hợp bốn kênh sẽ có 3 kênh màu (với các hiệp hội 1, 2 và 3 tương ứng) tiếp theo là một kênh opacity premultiplied. Nếu giá trị của otyp là 0, sau đó các trường NCH, PR và CVi sẽ không được tìm thấy |
2 |
Lớp ghép này quy định rằng các mẫu của một màu sắc đặc biệt được coi là hoàn toàn minh bạch (chroma key). Các màu sắc-key được quy định bởi các trường NCH, PR và CVi fields. |
|
Các giá trị được dành riêng. |
NCH: Số lượng các kênh. Trường này quy định cụ thể số lượng kênh được sử dụng để xác định màu khóa sắc độ. Giá trị này được tính bằng số lượng các kênh trong lớp ghép. Trường này được quy định như một số nguyên không dấu 1-byte.
CVi: giá trị Chroma-key. Trường này quy định cụ thể giá trị của kênh i cho màu sắc chroma-key. Mẫu phù hợp với các giá trị chroma-key cho tất cả các kênh được xem xét đầy đủ. Kích thước của Trường này được quy định bởi các bit độ sâu của các kênh tương ứng. Nếu giá trị không phải là một bội số của 8, thì mỗi giá trị CVi được đệm thêm để thành một bội số của 8 bit với các bit tương đương với bit dấu và giá trị thực tế phải được lưu trữ trong các bit ở vị trí thấp giá trị đệm. Ví dụ, nếu chiều sâu của một kênh là một giá trị đã ký 10-bit, thì giá trị CVi sẽ được lưu trữ trong 10 bit thấp của một trường 16-bit và các bậc cao 6 bit được tất cả bằng bit dấu giá trị trong Trường CVi này.
Bảng M.34 – Định dạng của nội dung của hộp Opacity
Tên trường |
Kích thước (bits) |
Giá trị |
otyp |
8 |
0-2 |
NCH |
8 0 |
0-255; nếu Otyp ≠2 không áp dụng; nếu Otyp = 2 |
CVi |
Biến đổi 0 |
Biến đổi; nếu Otyp ≠2 không áp dụng; nếu Otyp = 2 |
M.11.7.7 Hướng ngược đăng ký dòng mã
Khi kết hợp nhiều dòng mã để tạo ra một lớp ghép riêng biệt, điều quan trọng là các lưới tham chiếu của những dòng mã này được đăng ký đúng cách để đảm bảo đăng ký các mẫu riêng lẻ từ nhiều thành phần. Hướng ngược này quy định cụ thể cách những dòng mã này sẽ được đăng ký khi kết xuất lớp. Một hướng ngược tiêu đề lớp ghép hợp sẽ bao hàm không hoặc một hướng ngược đăng ký dòng mã và các hướng ngược đăng ký dòng mã sẽ không tìm thấy vị trí khác trong tập tin; một hướng ngược đăng ký dòng mã sẽ không được đặt vào hướng ngược tiêu đề JP2 để đặc tả đăng ký mặc định. Nếu bất kỳ hướng ngược tiêu đề ghép nào có chứa một hướng ngược đăng ký dòng mã, thì mỗi hướng ngược tiêu đề lớp ghép sẽ chứa một hướng ngược đăng ký dòng mã. Nếu hướng ngược tiêu đề lớp ghép này không chứa một hướng ngược đăng ký dòng mã, thì lớp ghép sẽ được thể hiện lại bởi một và chỉ một dòng mã.
Nếu đăng ký dòng mã không được chỉ định cho một lớp ghép cụ thể, thì các dòng mã trong lớp ghép đó sẽ được sắp xếp trực tiếp lưới tham chiếu của chúng ở cả hai tọa độ (0,0) và (1,1).
Nếu một hướng ngược đăng ký dòng mã tồn tại, thì độ phân giải hiển thị mặc định (quy định trong một hướng ngược phân giải với cùng một hướng ngược tiêu đề lớp ghép) sẽ áp dụng cho lưới đăng ký lớp ghép.
Đăng ký này được đặc tả có liên quan với lưới đăng ký lớp ghép độc lập.
Các dạng hướng ngược đăng ký dòng mã sẽ là ‘creg’ (0x6372 6567). Các nội dung của hướng ngược này sẽ như sau:
Hình M.23 – Tổ chức nội dung của hướng ngược đăng ký dòng mã
XS: Kích cỡ lưới phương ngang. Trường này quy định cụ thể số lượng các điểm lưới phương ngang trên lưới đăng ký lớp ghép được sử dụng để đo khoảng cách giữa các lưới tham chiếu của dòng mã riêng. Trường này được mã hóa như một số nguyên không dấu 2-byte.
YS: Kích cỡ lưới phương dọc. Trường này xác định số lượng các điểm lưới đoan phương dọc từ tọa độ (0.0) tới (0,1) trên lưới đăng ký lớp ghép. Các điểm lưới đoạn này được sử dụng để đo khoảng cách giữa lưới chuẩn của dòng mã riêng. Trường này được mã ó như một số nguyên không dấu 2-byte.
CDNi: Số dòng mã. Trường này quy định cụ thể số lượng dòng mã cho giá trị đăng ký này.
XRi: Độ phân giải phương ngang. Trường này xác định cụ thể khoảng cách theo phương ngang giữa các điểm trên lưới tham chiếu của dòng mã xác định bởi tham số CDNi, được đo bằng số lượng các điểm phân đoạn trên lưới đăng ký lớp ghép. Trường này có hiệu quả xác định tỉ lệ phương ngang cần thiết phù hợp với lưới tham chiếu của dòng mã với lưới đăng ký lớp ghép. Trường này được mã hóa như một số nguyên không dấu 1-byte.
YRi: độ phân giải theo phương dọc. Trường này xác định khoảng cách theo phương ngang giữa các điểm trên lưới tham chiếu của dòng mã được đặc tả bởi tham số CDNi, đo bằng số lượng các điểm phân đoạn trên lưới đăng ký lớp ghép. Trường này có hiệu quả xác định tỉ lệ phương dọc cần thiết phù hợp với lưới tham chiếu của dòng mã với lưới đăng ký lớp ghép. Trường này được mã hóa như một số nguyên không dấu 1-byte.
XOi: Độ lệch theo phương ngang. Trường này xác định khoảng cách theo ngang (phía bên phải) từ gốc của lưới đăng ký lớp ghép đến trung tâm của các điểm trên cùng bên trái trên lưới tham chiếu của dòng mã được đặc tả bởi tham số CDNi. Trường này được mã hóa như một số nguyên không dấu 1-byte. Giá trị của nó chắc chắn phải nhỏ hơn giá trị của XS.
YOi: Độ lệch theo phương dọc. Trường này xác định khoảng cách (hướng dưới) dọc từ gốc của lưới đăng ký lớp ghép tới trung tâm của điểm trái bên trên trên lưới tham chiếu của dòng mã xác định bởi tham số CDNi. Trường này được mã hóa như một số nguyên unsigned 1-byte. Giá trị của nó chắc chắn phải nhỏ hơn giá trị của YS.
Bảng M.35 – Định dạng nội dung của hướng ngược đăng ký dòng mã
Tên trường |
Kích cỡ (bits) |
Giá trị |
XS |
16 |
0-65 535 |
YS |
16 |
0-65 535 |
CDNi |
16 |
0-65 535 |
XRi |
8 |
0-255 |
YRi |
8 |
0-255 |
XOi |
8 |
0-255 |
YOi |
8 |
0-255 |
M.11.8 Hướng ngược dòng mã tiếp giáp
Trong một tập tin JPX, hộp Contiguous Codestream chứa toàn bộ dòng mã theo định nghĩa của cú pháp dòng mã. Tuy nhiên, không giống như các định dạng tập tin JP2, các dòng mã chứa trong một tập tin JPX không bị giới hạn dòng mã xác định bởi Phụ lục A của ITU-T Rec. T.800 | ISO / IEC 15.444- 1. Dòng mã chứa trong một tập tin JPX cũng có thể sử dụng phần mở rộng cho cú pháp dòng mã quy định tại Phụ lục A của Tiêu chuẩn này .
Hộp Contiguous Codestream được tìm thấy chỉ ờ cấp cao nhất của tập tin; chúng không được tìm thấy trong một superbox.
M.11.9 Hướng ngược dữ liệu truyền thông
Hộp Media Data chứa các mảnh vỡ của dòng mã JPEG 2000 hoặc dữ liệu truyền thông khác, chẳng hạn như dữ liệu âm thanh MPEG-4. Trong mọi trường hợp, phải có hộp khác trong tập tin đó xác định ý nghĩa của các dữ liệu trong hộp Media Data. Các ứng dụng không nên truy cập hộp Media Data trực tiếp, nhưng thay vào đó sử dụng bảng phân mảnh để xác định những phần nào trong đó hộp truyền thông dữ liệu đại diện cho một dòng mã JPEG 2000 hoặc dòng truyền thông khác hợp lệ.
Các loại hộp Media Data sẽ là ‘mdat’ (0x6D64 6174). Nội dung của một hộp Media Data nói chung không được xác định bởi Tiêu chuẩn này.
M.11.10 Hướng ngược ghép hợp (siêu khung)
Hộp Thành phần xác định cách kết hợp các lớp thành phần cá nhân để tạo ra các kết quả kết xuất. Nó bao gồm một tập hợp các tùy chọn toàn cầu, tiếp theo là một chuỗi của một hay nhiều bộ kết xuất (chúng được chứa trong một hộp Hướng dẫn thiết lập). Mỗi hướng dẫn riêng được kết hợp với một lớp thành phần trong tập tin và xác định cách hiển thị lớp thành phần: vị trí, quy mô, hoạt động tổng hợp của nó, vv…Một đầu đọc hỗ trợ thành phần và ảnh động sẽ hiển thị các tập tin có chứa các hộp Thành 272 phần bằng cách thực hiện chuỗi các hướng dẫn xác định trong hộp Thành phần. Chi tiết về các mô hình thành phần và ảnh động được quy định tại M.5.3. Một tập tin JPX phải có không hoặc một hộp Thành phần. Nếu có, hộp đó sẽ được tìm thấy ở cấp cao nhất của tập tin JPX; nếu không nó sẽ được tìm thấy trong một superbox.
Các loại hộp Thành phần sẽ là ‘comp’ (0x636F 6D70) và nó có các nội dung sau đây:
Hình M.24 – Tổ chức của nội dung của hộp thành phần
copt: hộp Tùy chọn Thành phần. Hộp này quy định các thông số áp dụng cho các thành phần hoặc ảnh động như một toàn thể. Nó được định nghĩa trong M.11.10.1.
iseti: hộp Hướng dẫn cài đặt. Hộp này có chứa một tập hợp các hướng dẫn cách kết hợp nhiều lớp thành phần trong tập tin. Toàn bộ các thiết lập của hộp hướng dẫn cài đặt xác định toàn bộ thành phần hoặc ảnh động, và được xử lý theo thứ tự chúng được tìm thấy trong hộp Thành phần. Hộp Composition Instruction được định nghĩa trong M.11.10.2.
Bảng M.36 – Định dạng của nội dung của hộp thành phần
Tham số |
Kích thước (bits) |
Giá trị |
copt |
Biến đổi |
Biến đổi |
iseti |
Biến đổi |
Biến đổi |
M.11.10.1 Các tùy chọn ghép hướng ngược
Các tùy chọn ghép hướng ngược xác định cụ thể các tham số áp dụng cho ghép hợp hoặc ảnh động như một tổng thể. Các tùy chọn ghép hướng ngược sẽ là hướng ngược đầu tiên trong hướng ngược ghép và một tùy chọn ghép hướng ngược sẽ không được tìm thấy trong bất kỳ vị trí nào khác trong tập tin.
Hình M.25 – Tổ chức các nội dung của các tùy chọn ghép khung
HEIGHT: Độ cao hiệu quả được kết xuất. Trường này đặc tả độ cao, trong các mẫu của hiệu quả được kết xuất. Độ phân giải của giá trị này là tùy chọn được định nghĩa trong hướng ngược phân giải hiển thị ngẫu nhiên trong hướng ngược tiêu đề JP2. Trường này được mã hóa như một số nguyên không dấu 4-byte.
WIDTH: Độ rộng hiệu quả được kết xuất. Trường này đặc tả độ rộng, trong các mẫu của hiệu quả được kết xuất. Độ phân giải của giá trị này là tùy chọn được định nghĩa trong hướng ngược phân giải hiển thị ngẫu nhiên trong hướng ngược tiêu đề JP2. Trường này được mã hóa như một số nguyên không dấu 4-byte.
GREPT: Lặp lại toàn cầu. Trường này đặc tả số lần lặp lại đầy đủ các chỉ lệnh hiển thị sau khi thực hiện các chỉ lệnh hiển thị lần thứ nhất. Đối với một giá trị GREPT bằng 0, điều này nghĩa là toàn bộ tập các chỉ lệnh trong hướng ngược ghép được thực hiện một lần. Giá trị bằng 256 biểu thị rằng bộ đọc sẽ lặp lại toàn bộ tập các chỉ lệnh không rõ ràng. Trước khi thực hiện mỗi tập lệnh, vùng hiển thị sẽ được quyết định với trạng thái gốc của nó và thiết lập lại tất cả các lệnh kết hợp lớp ghép. Mỗi vòng lặp thực hiện sẽ xem như tương đương với hiển thị lại ghép hỗn hợp. Trường này được mã hóa như một số nguyên không dấu 1-byte.
Bảng M.37 – Định dạng các nội dung của các tùy chọn ghép khung
Tham số |
Kích cỡ (bits) |
Giá trị |
HEIGHT |
32 |
1 -232-1 |
WIDTH |
32 |
1-232-1 |
GREPT |
8 |
0-255 |
M.11.10.2 Hướng ngược thiết lập chỉ lệnh
Một hộp Instruction Set chứa một tập hợp các hướng dẫn kết xuất, mỗi đại diện thông qua một loạt các thông số thành phần. Ngoài ra, toàn bộ các hướng dẫn chứa trong hộp này có thể được lặp đi lặp lại theo một số lặp lại; lặp đi lặp lại điều này xảy ra trước khi bộ đọc tiếp tục trên với các hướng dẫn tìm thấy trong hộp Instruction Set tiếp theo trong hộp Thành phần. Hộp Instruction Set được tìm thấy chỉ trong một hộp Thành phần; chúng sẽ không thể tìm thấy ở bất kỳ địa điểm khác trong tập tin.
Các loại hộp Instruction Set sẽ là ‘inst’ (0x696E 7374) và nội dung của hộp có các định dạng sau:
Hình M.26 – Tổ chức nội dung của hộp cài đặt hướng dẫn
Ityp: Kiểu lệnh. Trường này quy định các loại hướng dẫn, và do đó mà các thông số hướng dẫn được tìm thấy trong phần hộp Composition Instruction này. Trường này được mã hóa như một cờ 16-bit. Ý nghĩa của mỗi bit trong cờ như sau:
Bảng M.38 – Các giá trị trường Ityp
|
Giá trị |
|
Ý nghĩa |
0000
0000 |
0000 | 0000 | Không có hướng dẫn được trình bày, và do đó không có hướng dẫn được định nghĩa cho các lớp ghép trong các tập tin. |
xxxx
xxx1 |
xxxx | xxxx | Mỗi hướng dẫn có chứa các thông số XO và YO. |
xxxx
xx1x |
xxxx | xxxx | Mỗi hướng dẫn chứa các thông số WIDTH và HEIGHT. |
xxxx
x1xx |
xxxx | xxxx | Mỗi hướng dẫn có chứa các LNẾUE, N và kéo dài các thông số ảnh động. |
xxxx
xxxx |
xxxx | xxxlx | Mỗi hướng dẫn xác định các thông số cây trồng XC, YC, WC và HC. |
Tất cả các giá trị được dành riêng. |
REPT: Sự lặp lại. Trường này đặc tả số lần lặp lại tập các lệnh đặc thù này sau khi thực hiện tập lệnh lần thứ nhất. Các chỉ lệnh luôn được thực hiện ít nhất một lần (REPT là không) và chỉ lệnh có thể ứng dụng với các lớp ghép khác nhau trên mỗi lần lặp lại như được quyết định bởi trường Next-use của các lệnh. Trường này được mã hóa như một 2-byte big endian số nguyên không dấu. Một giá trị 65 535 chỉ ra để lặp lại chỉ lệnh vô hạn định.
TICK: Thời gian hẹn giờ. Trường này quy định cụ thể thời gian của một bộ đếm đánh dấu thời gian (được sử dụng bởi các tham số hướng dẫn LNẾUE) tính bằng mili giây. Trường này được mã hóa như một số nguyên không dấu big endian 4-byte. Nếu trường Ityp xác định rằng các thông số hướng dẫn LNẾUE không được sử dụng, thì Trường này sẽ được thiết lập là 0, và sẽ được bộ đọc bỏ qua .
INSTi: Hướng dẫn. Trường này quy định một loạt các thông số hướng dẫn cho một lệnh duy nhất. Định dạng của Trường này được quy định tại M.11.10.2.1.
Bảng M.39 – Định dạng nội dung của hộp cài đặt hướng dẫn
Tham số |
Kích thước (bits) |
Giá trị |
Ityp |
16 |
0-65 535 |
REPT |
16 |
0-65 535 |
TICK |
32 |
0-(232-1) |
INSTi |
Variable |
Variable |
M.11.10.2.1 Tham số chỉ lệnh
Hình M.27 thể hiện nội dung của từng trường INST (một hướng dẫn thành phần duy nhất) trong một hộp Instruction Set:
Hình M.27 – Tổ chức nội dung của trường INST trong hộp cài đặt hướng dẫn
XO: độ lệch ngang. Trường này xác định vị trí ngang mà tại đó góc trên bên trái của lớp ghép bị tác động bởi các hướng dẫn này phải được đặt trong khu vực kết xuất, trong các mẫu. Trường này được mã hóa như một số nguyên không dấu big endian 4-byte. Nếu Trường này không có, một giá trị mặc định bằng 0 được sử dụng.
YO: độ lệch dọc. Trường này xác định vị trí thẳng đứng mà tại đó góc trên bên trái của lớp ghép bị tác động bởi các hướng dẫn này phải được đặt trong khu vực kết xuất, trong các mẫu. Trường này được mã hóa như một số nguyên không dấu big endian 4-byte. Nếu Trường này không có, một giá trị mặc định bằng 0 được sử dụng.
WIDTH: Chiều rộng của lớp ghép hiện hành. Trường này xác định chiều rộng trên diện tích kết xuất, trong các mẫu hiển thị, để mở rộng và làm cho lớp ghép bị tác động bởi các hướng dẫn này. Trường này được mã hóa như một số nguyên không dấu big endian 4-byte. Nếu Trường này không có, một giá trị mặc định bằng 0 được sử dụng.
HEIGHT: Chiều cao của lớp ghép hiện hành. Trường này xác định chiều cao trên diện tích kết xuất, trong các mẫu hiển thị, để mở rộng và làm cho lớp ghép bị tác động bởi các hướng dẫn này. Trường này được mã hóa như một số nguyên không dấu big endian 4-byte. Nếu Trường này không có, một giá trị mặc định bằng 0 được sử dụng.
PERSIST: Tính bền. Trường này xác định xem mẫu kết xuất hiển thị như là một kết quả của việc thực hiện các hướng dẫn hiện hành kéo dài trên nền màn hình hoặc nếu nền hiển thị sẽ được thiết lập lại trạng thái của nó trước khi thực hiện hướng dẫn này, trước khi thực hiện các hướng dẫn tiếp theo. Trường này được mã hóa là một trường boolean 1-bit. Một giá trị 1 cho biết sự thật, rằng các lớp ghép hiện hành vẫn tồn tại. Nếu Trường này không có, tính bền sẽ được thiết lập là true.
LNẾUE: Thời gian của hướng dẫn này. Trường này quy định cụ thể số lượng đánh dấu thời gian lý tưởng nên xảy ra giữa hoàn thành việc thực hiện các hướng dẫn hiện hành và hoàn thành thực hiện của lệnh tiếp theo. Một giá trị của không chỉ ra rằng các hướng dẫn hiện hành và các hướng dẫn tiếp theo sẽ được thực hiện trong cùng một cập nhật hiển thị; điều này cho phép một hướng ngược hình duy nhất từ các ảnh động được tạo thành từ bản cập nhật cho nhiều lớp ghép. Một giá trị của 231-1 chỉ ra một sự chậm trễ vô thời hạn hoặc tạm dừng cho tương tác người dùng. Trưởng này được mã hóa như một số nguyên không dấu big endian 31-bit. Nếu Trường này không có, tồn tại hướng dẫn sẽ được thiết lập là 0.
NEXT-USE: Số chỉ lệnh trước khi tái sử dụng. Trường này đặc tả số lượng các chỉ lệnh sẽ được thực hiện trước khi tái sử dụng lớp ghép hiện tại. Trường này cho phép bộ đọc dễ dàng tối ưu hóa bộ nhớ đệm chiến lược của chúng. Một giá trị 0 ngụ ý rằng ảnh hiện tại sẽ không được tái sử dụng cho bất kỳ chỉ lệnh tiếp theo nào, mặc dù việc thực hiện một vòng lặp toàn cầu như là kết quả của một giá trị khác không của tham số GREPT trong tùy chọn ghép khung. Một giá trị 1 ngụ ý rằng lớp ghép hiện tại sẽ được sử dụng với lệnh tiếp theo và cứ thế. Lớp ghép tiếp theo cho tái sử dụng theo cách này phải là lớp ghép gốc, trước khi bất kỳ sự cắt xén hoặc tỷ lệ được biểu thị bởi lệnh hiện tại. Nếu trường này không có, số lượng lệnh sẽ được thiết lập là không, chỉ ra rằng lớp ghép hiện tại sẽ không được tái sử dụng. Trường này được mã hóa như một số nguyên không dấu big endian 4-byte.
XC: độ lệch cắt ngang. Trường này xác định khoảng cách ngang trong các mẫu với cạnh trái của phần mong muốn của các lớp ghép hiện hành. Phần mong muốn được cắt từ các lớp ghép và sau đó được đưa ra bởi các hướng dẫn hiện hành. Nếu trường này là không có, offset cắt ngang được thiết lập là 0. Trường này được mã hóa như một số nguyên không dấu big endian 4-byte.
YC: độ lệch cắt dọc. Trường này xác định khoảng cách dọc trong các mẫu với cạnh trái của phần mong muốn của các lớp ghép hiện hành. Phần mong muốn được cắt từ các lớp ghép và sau đó được đưa ra bởi các hướng dẫn hiện hành. Nếu trường này là không có, offset cắt ngang được thiết lập là 0. Trường này được mã hóa như một số nguyên không dấu big endian 4-byte..
WC: chiều rộng được cắt. Trường này xác định khoảng cách ngang trong các mẫu của các phần mong muốn của các lớp ghép hiện hành. Phần mong muốn được cắt từ các lớp ghép và sau đó được đưa ra bởi các hướng dẫn hiện hành. Nếu trường này là không có, chiều rộng cắt phải được thiết lập chiều rộng của lớp ghép hiện hành Trường này được mã hóa như một số nguyên không dấu big endian 4- byte.
HC: chiều cao cắt. Trường này xác định khoảng cách dọc trong các mẫu của các phần mong muốn của các lớp ghép hiện hành. Phần mong muốn được cắt từ các lớp ghép và sau đó được đưa ra bởi các hướng dẫn hiện hành. Nếu trường này là không có, chiều rộng cắt phải được thiết lập chiều rộng của lớp ghép hiện hành Trường này được mã hóa như một số nguyên không dấu big endian 4-byte.
Tham chiếu tới Ityp trong các thông số hướng dẫn cá nhân trong Bảng M.40 đề cập đến trường Ityp trong hộp Instruction Set có chứa hướng dẫn này.
Bảng M.40 – Định dạng nội dung của tham số INSTi trong hộp cài đặt hướng dẫn
Tham số |
Kích thước (bits) |
Giá trị |
XO |
32 |
0-(232-1); nếu Ityp chứa xxxx xxxx xxxx |
|
0 |
xxx1 Không áp dụng khác |
YO |
32 |
0-(232-1); Nếu Ityp chứa xxxx xxxx xxxx |
|
0 |
xxx1 Không áp dụng khác |
WIDTH |
32 |
0-(232-1); nếu Ityp chứa xxxx xxxx xxxx |
|
0 |
xx1x Không áp dụng khác |
HEIGHT |
32 |
0-(232–1); nếu Ityp chứa xxxx xxxx xxxx |
|
0 |
xx1x Không áp dụng khác |
PERSIST |
1 |
0, 1; nếu Ityp chứa xxxx xxxx xxxx 1xxx |
|
0 |
Không áp dụng khác |
LNẾUE |
31 |
0-(231-1 ); nếu Ityp chứa xxxx xxxx xxxx |
|
0 |
1xxx Không áp dụng khác |
NEXT-USE |
32 |
0-(231-1); nếu Ityp chứa xxxx xxxx xxxx 1xxx Không áp dụng khác |
XC |
32 |
0-(232-1); nếu Ityp chứa xxxx xxxx xx1x |
|
0 |
xxxx Không áp dụng khác |
YC |
32 |
0-(232–1); nếu Ityp chứa xxxx xxxx xx1x |
|
0 |
Xxxx Không áp dụng khác |
WC |
32 |
0-(232-1); nếu Ityp chứa xxxx xxxx xx1x |
|
0 |
xxxx Không áp dụng khác |
HC |
32 |
0-(232-1); nếu Ityp chứa xxxx xxxx xx1x |
|
0 |
xxxx Không áp dụng khác |
M.11.11 Hướng ngược liên kết (siêu khung)
Hộp Association cho phép dữ liệu trong các tập tin được liên kết với các dữ liệu khác trong tập tin. Hộp Association là một superbox, có chứa một chuỗi của hai hoặc nhiều hộp. Nó tạo ra các hiệp hội độc lập giữa các hộp nó chứa hoặc các tổ chức đại diện bởi những hộp. Đặc biệt, các hiệp hội được tạo ra giữa các hộp đầu tiên (hoặc tổ chức đại diện bởi nó) (gọi tắt là BF) và mỗi hộp khác (hoặc tổ chức đại diện) (gọi tắt là Bi) trong chuỗi. Trong trường hợp có nhiều hơn một hộp Bi, nó có thể được coi là tạo ra cụm ngữ nghĩa xung quanh hộp BF. Không có liên kết rõ ràng giữa các hộp Bi.
Ví dụ, hộp liên kết có thể được sử dụng để kết hợp một nhãn với một thực thể (ảnh, bộ ảnh, tài liệu siêu dữ liệu, vv) bằng cách đặt một hộp Label trong hộp Association như BF và các hộp thích hợp khác như các hộp Bi. Nó cũng có thể được sử dụng để kết hợp một số mục của siêu dữ liệu với cùng một ảnh hoặc ảnh thiết lập bằng cách đặt một hộp Number List như BF, tiếp theo là các hộp siêu dữ liệu như các hộp Bi. Ngoài ra, nó có thể được sử dụng để tạo ra mức độ khác nhau của các hiệp hội, ví dụ như để liên kết một số siêu dữ liệu với một khu vực quan tâm (ROI) và sau đó kết hợp ROI và siêu dữ liệu của mình với một ảnh hoặc bộ ảnh. Những ví dụ minh họa trong hình M.28 đến M.31.
Hình M.28 – Ví dụ về siêu dữ liệu đặc trưng ROI liên kết với một hoặc nhiều ảnh
Hình M.29 – Ví dụ về đa tài liệu XML liên kết với một hoặc nhiều ảnh
Hình M.30 – Ví dụ về nhãn tài liệu XML
Hình M.31 – Ví dụ về ảnh nhãn
Hộp Association hội là tùy chọn, và có thể có nhiều hộp Association trong tập tin. Một hộp Association có thể được tìm thấy bất cứ nơi nào trong tập tin ngoại trừ trước hộp Reader Requirements. Các loại hộp Association sẽ là ‘asoc’ (0x6173 6F63). Các nội dung của hộp Association được quy định như sau:
Hình M.32 – Tổ chức nội dung của hộp liên kết
BF: hộp đầu tiên. Đây là hộp mà tất cả các hộp khác trong hộp Association này có liên quan. Bi: Box có liên quan. Đây có thể là bất kỳ hộp khác so với những hộp bị hạn chế xảy ra tại các địa điểm cụ thể trong các tập tin. Hộp này sẽ được kết hợp với hộp BF.
Bảng M.41 – Định dạng nội dung của hộp liên kết
Tham số |
Kích thước (bits) |
Giá trị |
BF |
Biến đổi |
Biến đổi |
Bi |
Biến đổi |
Biến đổi |
M.11.12 Hướng ngược danh mục số
Hộp Number List có chứa một danh sách các số chỉ định các đơn vị trong tập tin. Trong một hộp Association, một hộp Number List đại diện cho các thực thể được liệt kê. Các loại hộp Number List sẽ là ‘nlst’ (0x6E6C 7374). Nội dung của hộp Number List được thực hiện như sau:
Hình M.33 – Tổ chức nội dung của hộp danh sách số
ANi: Số liên kết. Trường này xác định số lượng của một thực thể mà dữ liệu trong cùng một hộp Association có liên quan. Giá trị này được lưu giữ như một số nguyên không dấu big endian 4-byte, nơi mà các byte thứ tự cao quy định các loại thực thể dữ liệu có liên quan, và 3 byte thứ tự thấp xác định số lượng của thực thể đó. Giá trị hợp lệ của trường này như sau:
Bảng M.42 – Giá trị trường ANi
Giá trị |
Ý nghĩa |
0x0000 0000 | The rendered result. |
0x01XX xxxx | The low three Hoặcder bytes (of giá trị i) specnếuy Codestream i in the JPX file. |
0x02XX XXXX | The lower three Hoặcder bytes (of giá trị i) specnếuy Hợp lại Layer i in the JPX file. |
All other giá tris reserved. |
Bảng M.43 – Định dạng nội dung của hộp danh sách số
Tham số |
Kích thước (bits) |
Giá trị |
ANi |
32 |
0-(232-1) |
M.11.13 Hướng ngược nhãn
Hộp Label chứa một nhãn văn bản có thể được liên kết với một hoặc nhiều thực thể trong tập tin bằng cách chứa các hộp Label trong một hộp Association, một hộp Codestream Tiêu đề, hoặc một hộp Hợp lại Layer Tiêu đề.
Các loại hộp Label sẽ là “Ibl \ 040 ‘(0x6C62 6C20). Các nội dung của hộp Label như sau:
Hình M.34 – Tổ chức nội dung của hộp nhãn
S: Dòng nhãn. Một nhãn văn bản liên quan đến một thực thể. Giá trị này được lưu giữ như các ký tự ISO / IEC 10646 trong bảng mã UTF-8. Các ký tự trong phạm vi u + 0000 đến u + 001F và u + 007F đến u + 009F, cũng như các ký tự cụ thể ‘/’, ‘;’, ‘?’, ‘:’ Và ‘#’, không cho phép trong chuỗi nhãn. Chuỗi Label không được kết thúc với một kí tự ‘\0’ hoặc được đệm trong bất kỳ cách nào; mỗi ký tự đó hiện có là đáng kể.
M.11.14 Hướng ngược lọc nhị phân
Hộp Lọc nhị phân cho phép các phần của tập tin được nén hoặc mã hóa (ví dụ, mã hóa) hơn nữa. Ví dụ, nếu các tập tin có chứa một lượng đáng kể các siêu dữ liệu trong XML, nó có thể được nén không tổn hao để giảm đáng kể kích thước tập tin. Hộp này có chứa một chỉ số xác định cách chuyển đổi dữ liệu, cũng như các dữ liệu chuyển đổi. Một khi dữ liệu được chuyển thông qua các hoạt động ngược lại (ví dụ, giải mã hoặc giải nén), các dữ liệu kết quả sẽ là một chuỗi các hộp, nơi mà các byte đầu tiên là byte đầu tiên của tiêu đề hộp đầu tiên, và byte cuối cùng là byte cuối cùng của hộp cuối cùng. Hộp Lọc nhị phân là tùy chọn, và có thể có nhiều hộp lọc nhị phân trong tập tin. Một hộp lọc nhị phân có thể tìm thấy bất cứ nơi nào trong tập tin ngoại trừ trước hộp Yêu cầu bộ đọc.
Một bộ giải mã phù hợp là không cần thiết để xử lý các dữ liệu trong một hộp lọc nhị phân. Do đó, một hộp lọc nhị phân sẽ không chứa hộp mà giải thích là cần thiết cho bộ đọc phù hợp. Các loại hộp lọc nhị phân sẽ là ‘bfil’ (0x6266 696C). Các nội dung của hộp lọc nhị phân được định nghĩa như sau:
Bảng M.35 – Tổ chức nội dung của hộp lọc nhị phân
F: Loại Filter. Trường này quy định cụ thể cách dữ liệu đã được chuyển đổi trước khi lưu trữ. Giá trị này được mã hóa như là một UUID. Tiêu chuẩn xác định giá trị là:
Bảng M.44 – Loại bộ lọc hợp lệ
Giá trị |
Ý nghĩa |
EC340B04-74C5-11D4-A729- 879EA3548F0E | Nén bằng GZIP. Nội dung của trường dữ liệu đã được nén bằng cách sử dụng DEFLATE algHoặcithm (như được mô tả trong RFC 1951). Dữ liệu nén được giữ lại trong cấu trúc nhị phân được định nghĩa bởi tệp tin GHOST của GZIP, như được định rõ trong RFC 1952. |
EC340B04-74C5- 11D4-A729- 879EA3548F0F | Mã hóa bằng DES. Nội dung của trường DATA đã được mã hóa bằng DES như được định nghĩa trong ISO 10126-2. |
Tất cả các giá trị khác được dành riêng. |
Nếu một bộ đọc phù hợp không nhận ra UUID cụ thể, thì bộ đọc sẽ bỏ qua hộp thoại Filter nhị phân này.
DATA: dữ liệu được biến đổi. Trường này trước đây có chứa chuyển đổi dữ liệu. Sau khi chuyển đổi ngược lại đã được áp dụng (theo quy định của F), kết quả sẽ là một chuỗi các hộp. Nội dung của trường dữ liệu có thể bao gồm thông tin cần thiết để thực hiện các bộ lọc ngược lại, ngoài các dữ liệu lọc. Nó hoàn toàn lên đến định nghĩa của các trường F để xác định cấu trúc nhị phân và định dạng của các trường DATA.
Bảng M.45 – Khuôn dạng nội dung của hộp lọc nhị phân
Tham số |
Kích thước (bits) |
Giá trị |
F |
128 |
Biến đổi |
DATA |
Biến đổi |
Biến đổi |
M.11.15 Hướng ngược tái bản mong muốn (siêu khung)
Hộp Desired Reproductions xác định một tập hợp các biến đổi phải được áp dụng cho các ảnh để đảm bảo tái bản mong muốn cụ thể về một tập hợp các thiết bị đầu ra khác nhau, tương ứng. Ví dụ, hãy xem xét một ảnh có chứa màu xanh trung thực. Ảnh này được dự định in trong một cửa hàng, và do đó các ảnh in phải phù hợp với màu sắc thực tế của các đối tượng vật lý ban đầu khi con người xem nó. Tuy nhiên, quá trình in ấn CMYK không tái tạo cùng một loạt các màu sắc xanh như có thể xem được bởi hệ thống thị giác của con người. Trong trường hợp này, các máy móc phải xác định làm thế nào để chuyển đổi tốt nhất màu xanh trong ảnh vào một màu xanh in để giảm thiểu sự khác biệt giữa các đối tượng vật lý từ bản in.
Một bộ đọc JPX không cần phải xử lý ảnh thông qua những biến đổi nhất định.
Hộp này có chứa một tập hợp các bản sao mong muốn riêng. Chỉ có một hộp Desired Reproductions trong tập tin, có thể tìm thấy bất cứ nơi nào trong tập tin.
Các loại hộp Desired Reproductions là ‘drep’ (0x6472 6570). Hộp này là một superbox, và các nội dung của hộp được quy định như sau:
Hình M.36 – Tổ chức nội dung của hộp xuất bản mong muốn
gtso: Hộp đầu ra tiêu chuẩn Công nghệ đồ họa. Hộp này xác định màu sắc đầu ra và tông mong muốn cho các kết quả kết xuất khi in trong điều kiện in ấn thương mại. Các định dạng và định nghĩa của hộp này được quy định tại M.11.15.1
Hộp khác có thể được tìm thấy trong hộp Desired Reproductions. Bộ đọc sẽ bỏ qua bất kỳ hộp mà chúng không hiểu.
Hộp Desired Reproduction là tùy chọn cho phù hợp với tập tin.
M.11.15.1 Hướng ngược đầu ra tiêu chuẩn công nghệ đồ họa
Một hộp đầu ra tiêu chuẩn Công nghệ đồ họa quy định cụ thể tiêu chuẩn sản xuất mong muốn của kết quả kết xuất cho in ấn thương mại và hệ thống kiểm chứng. Hộp có chứa một dạng file Output ICC xác định chuyển đổi mong muốn của ảnh từ không gian kết nối thông tin (PCS) cho khoảng màu đầu ra cụ thể thiết bị được mong muốn. Sẽ chỉ có không hoặc một hộp hộp đầu ra tiêu chuẩn Công nghệ đồ trong tập tin. Nếu có, hộp này được tìm thấy trong các hộp Desired Reproductions.
Các loại của hộp đầu ra tiêu chuẩn Công nghệ đồ họa là ‘gtso’ (0x6774 736F). Các nội dung của hộp được quy định như sau:
Hình M.37 – Tổ chức nội dung hộp đầu ra chuẩn công nghệ đồ họa
Outp: trường này có một thông tin Out ICC hợp lệ theo quy định của định dạng thông tin ICC đặc tả ICC-1. Phiên bản thông tin được nhúng vào trong hồ sơ cá nhân riêng của nó. Các ứng dụng mà chỉ hỗ trợ phiên bản cụ thể của Profile FHoặcmat Specnếuications có thể trích xuất các số phiên bản từ 8- 11 byte của hồ sơ (8-11 byte của nội dung của hộp Output ICC Profile).
Bảng M.46 – Khuôn dạng nội dung của hộp đầu ra chuẩn công nghệ đồ họa
Tham số |
Kích thước (bits) |
Giá trị |
OUTP |
Biến đổi |
Biến đổi |
M.11.16 Hướng ngược mô tả ROI
Một hộp Mô tả ROI chứa thông tin về các phần của một ảnh mà có thể có ích trong một số ứng dụng như truy cập ngẫu nhiên. Hộp mô tả ROI cũng có thể được sử dụng cùng với hộp hiệp hội để liên kết siêu dữ liệu đến các bộ phận của ảnh. Các ROIs mô tả trong hộp này không nhất thiết phải được mã hóa như ROIs trong dòng mã; nó cũng cho phép một ứng dụng hoặc sử dụng để báo hiệu tầm quan trọng của một số phần của một ảnh ngay cả khi các phần đó không được nhấn mạnh bởi các điểm đánh dấu đoạn RGN hoặc ARN trong dòng mã. Có thể có nhiều hộp Mô tả ROI trong tập tin. Tuy nhiên, một hộp Mô tả ROI được tìm thấy chỉ ở cấp cao nhất của tập tin, hoặc trong hộp JP2 Tiêu đề, một hộp Codestream Tiêu đề hoặc một hộp Hiệp hội. Nếu hộp Mô tả ROI được tìm thấy trong một hộp Codestream Tiêu đề, thì các ROIs mô tả trong hộp Mô tả ROI liên quan đến các dòng mã cụ thể được mô tả bởi hộp Codestream Tiêu đề. Nếu hộp Mô tả ROI được tìm thấy trong hộp JP2 Tiêu đề, thì hộp mô tả ROI xác định thông tin ROI mặc định cho tất cả các dòng mã. Nếu hộp Mô tả ROI được tìm thấy ở cấp cao nhất của tập tin, thì nó xác định thông tin ROI cho kết quả kết xuất; các ROIs mô tả tại một hộp cấp cao không trực tiếp gắn với ROIs mã hóa trong bất kỳ dòng mã nào.
Các loại hộp Mô tả ROI là ‘roid’ (0x726F 6964). Nội dung của hộp này được thực hiện như sau:
Hình M.38 – Tổ chức nội dung của hộp mô tả ROI
Nroi: Số lượng các khu vực yêu thích. Mã hóa như một số nguyên 8-bit.
Ri: Khu vực lãi hiện tại trong dòng mã. Mã hóa như một số nguyên 8-bit. Giá trị hợp lệ của trường Ri như sau:
Bảng M.47 – Các giá trị hợp lệ Ri
Giá trị |
Ý nghĩa |
0 |
Dòng mã không chứa một vùng tĩnh quan tâm tại vị trí này. |
1 |
Dòng mã chứa một khu vực tĩnh quan tâm tại vị trí này. |
|
Tất cả các giá trị dành riêng |
Rtypi: Khu vực của loại hình lãi, có thể là hình chữ nhật hoặc elip. Mã hóa như một số nguyên 8-bit. Giá trị hợp lệ của trường Rtypi như sau:
Bảng M.48 – Giá trị hợp lệ Rtypi
Giá trị |
Ý nghĩa |
0 |
Khu vực hình chữ nhật quan tâm. |
1 |
Khu vực hình elip quan tâm. |
|
Tất cả các giá trị dành riêng |
Rcpi: Khu vực lãi ưu tiên mã hóa. Giá trị này mô tả các ưu tiên mã hóa của khu vực yêu thích. Giá trị 0 có nghĩa là ưu tiên mã hóa thấp và 255 có nghĩa là ưu tiên mã hóa tối đa. Giá trị này được mã hóa như một số nguyên không dấu 1-byte. Trong các ứng dụng chuyển mã, bit nên được phân bổ đối với các ưu tiên mã hóa của mỗi ROI.
Rlcxi: Khu vực yêu thích vị trí nằm ngang. Trong trường hợp của khu vực hình chữ nhật là vị trí của góc trên bên trái của hình chữ nhật. Trong trường hợp của một khu vực elliptic yêu thích, đây là vị trí nằm ngang của các điểm trung tâm. Giá trị này được lưu giữ như một số nguyên không dấu big endian 4-byte.
Rlcyi: Khu vực yêu thích vị trí thẳng đứng. Trong trường hợp của khu vực hình chữ nhật, đây là vị trí của góc trên bên trái của hình chữ nhật. Trong trường hợp của một khu vực elliptic yêu thích, đây là vị trí dọc của điểm trung tâm. Giá trị này được lưu giữ như một số nguyên không dấu big endian 4-byte.
Rwdti: Khu vực lãi rộng. Trong trường hợp của khu vực hình chữ nhật yêu thích, đây là chiều rộng của hình chữ nhật. Trong trường hợp của một khu vực elliptic yêu thích, đây là trục nằm ngang. Giá trị này được lưu giữ như một số nguyên không dấu big endian 4-byte.
Rhthi: Vùng lãi cao. Trong trường hợp của khu vực hình chữ nhật yêu thích, đây là chiều cao của hình chữ nhật. Trong trường hợp của một khu vực elliptic yêu thích, đây là trục thẳng đứng. Giá trị này được lưu giữ như một số nguyên không dấu big endian 4-byte.
Bảng M.49 – Khuôn dạng nội dung của hộp ROI mô tả
Tham số |
Kích thước (bits) |
Giá trị |
Nroi |
8 |
0-255 |
Ri |
8 |
0-255 |
Rtypi |
8 |
0-255 |
Rlcxi |
32 |
1-(232-1) |
Rlcyi |
32 |
1-(232-1) |
Rwdti |
32 |
1-(232-1) |
Rhthi |
32 |
1-(232-1) |
M.11.17 Hướng ngược ký số
Hộp này có chứa một kiểm tra tổng thể hoặc chữ ký số có thể được sử dụng để xác minh dữ liệu chứa trong các tập tin. Chữ ký số này được sử dụng để bảo vệ một dòng byte rất cụ thể trong tập tin. Bất kỳ thay đổi mà dòng byte sẽ mất hiệu lực chữ ký số. Ví dụ, nếu một dòng mã nén được ký kết, và sau đó được sửa đổi bằng cách thêm dấu hiệu khả năng phục hồi lỗi, chữ ký số sẽ cho biết rằng các dòng byte đã được sửa đổi.
Các loại hộp Chữ ký số là ‘chck’ (0x6368 636B). Hộp Chữ ký số là tùy chọn và có thể xảy ra bất cứ nơi nào trong tập tin ngoại trừ trước hộp Yêu cầu bộ đọc. Có thể có nhiều hơn một hộp chữ ký số trong tập tin. Nội dung của một hộp chữ ký số được thực hiện như sau:
Figure M.39 – Tổ chức các nội dung của một hộp Chữ ký Kỹ thuật số
Styp: loại Chữ ký. Trường này quy định các loại chữ ký số được chứa trong hộp Chữ ký số này. Trường này được mã hóa như một số nguyên không dấu 1-byte. Giá trị hợp lệ của trường styp như sau:
Bảng M.50 – Giá trị hợp lệ Styp
Giá trị |
Giải thích |
0 |
Một kiểm tra, được tạo ra bằng cách áp dụng các thuật toán MD5 đối với dữ liệu nguồn, được lưu trữ trong trường dữ liệu hộp chữ ký số này như là một chuỗi các byte theo thứ tự được chỉ định bởi RFC 1321. |
1 |
Checksum được tạo ra bằng cách áp dụng các thuật toán SHA-1, như được định nghĩa trong ANSI X9.30.2, đối với các dữ liệu nguồn. Kết quả chữ ký được lưu trữ trong trường dữ liệu hộp chữ ký số này là 20-byte số nguyên không dấu bia endian . |
2 |
Chữ ký số được tạo ra bằng cách áp dụng thuật toán DSA, như được định nghĩa trong FIPS 186-2, cho dữ liệu nguồn. Chữ ký bao gồm hai số nguyên không dấu, r và s. Trường dữ liệu sẽ là 40 byte dài. 20 byte đầu tiên sẽ là giá trị r, mã hóa như một 20-byte số nguyên không dấu big endian. 20 byte thứ hai sẽ là giá trị s, mã hóa như một 20-byte số nguyên không dấu big endian. |
3 |
Một chữ ký kỹ thuật số, được tạo ra bằng cách áp dụng thuật toán RSA chữ ký với các thuật toán MD5 tiêu hóa tin nhắn (theo PKCS #1 Phiên bản 1.5) vào các nguồn dữ liệu, được lưu trữ trong lĩnh vực dữ liệu hộp chữ ký điện tử này. |
4 |
Một chữ ký số, được tạo ra bằng cách áp dụng thuật toán RSA chữ ký với các thuật toán SHA-1 tiêu hóa bản tin (theo PKCS #1 Phiên bản 1.5) vào các nguồn dữ liệu, được lưu trữ trong trường dữ liệu hộp chữ ký số này. |
5 |
Giá trị ContentInfo của cú pháp mật mã được lưu trữ trong trường dữ liệu hộp chữ ký số này. Trường ‘nội dung’ của nó sẽ chứa một giá trị DigestedData hoặc một giá trị SignedData, và trong cả hai trường hợp phải sử dụng cơ chế ‘chữ ký bên ngoài’ được mô tả trong phần 5.2 của RFC 2630 để áp dụng được lựa chọn tiêu hóa hoặc giải thuật ký vào các nguồn dữ liệu. |
|
Tất cả các giá trị khác dự phòng |
Nếu quản lý chính không phải là một vấn đề đối với một ứng dụng cụ thể (ví dụ, nếu một checksum đang được gửi đi, hoặc nếu người nhận đã biết khóa công khai để xác minh chữ ký), và nếu các phương pháp CMS (Styp = 5) được sử dụng, nó có thể giúp bộ đọc đơn giản để bao gồm trong các tập tin một hộp Digital Signature thêm bằng một trong những phương pháp khác (Styp <5) trên các dữ liệu cùng một nguồn. Bộ đọc không có hỗ trợ CMS vẫn sẽ có thể xử lý các hộp bổ sung.
Xác định bất kỳ phím nào được yêu cầu nằm ngoài phạm vi của Tiêu chuẩn này.
Ptyp: Loại con trỏ Nguồn. Trường này cho thấy cách ký kết nhiều nguồn dữ liệu bởi hộp chữ ký số này được quy định. Trường này được mã hóa như một số nguyên không dấu 1-byte. Giá trị hợp lệ của trường Ptyp như sau:
Bảng M.51 – Giá trị hợp lệ Ptyp
Giá trị |
Ý nghĩa |
0 |
Các nguồn dữ liệu được ký bởi hộp chữ ký số sẽ được tất cả các byte của tập tin, bắt đầu với các byte đầu tiên, cho đến byte ngay trước tiêu đề hộp cho hộp Chữ ký số này. Nếu các nguồn dữ liệu được chỉ định sử dụng Ptyp bằng 0, thì hộp Chữ ký số này không được thực hiện bất kỳ superbox trong file; nó phải được ở cấp cao nhất của tập tin. |
1 |
Các nguồn dữ liệu được ký bởi hộp chữ ký số sẽ được tất cả các byte của tập tin, bắt đầu với các byte tại vị trí xác định bởi trường OFF. Chiều dài của phạm vi này được xác định bởi trường LEN. Nếu các nguồn dữ liệu được chỉ định sử dụng Ptyp bằng 0 thì OFF nêu sự khởi đầu của một tiêu đề hộp và phạm vi nguồn bao gồm hộp chỉ đầy đủ; hộp chữ ký số phải ở cùng cấp trong hệ thống phân cấp hộp như hộp chỉ đến bởi trường OFF.. |
|
Tất cả các giá trị khác được bảo lưu. |
OFF: offset dữ liệu nguồn. Trường này quy định cụ thể sự offset trong byte bắt đầu của dãy nguồn dữ liệu được ký bởi hộp chữ ký số này. Offset này liên quan đến các byte đầu tiên của tập tin. Trường này được mã hóa như là một số nguyên không dấu big endian 8-byte. Nếu giá trị của Ptyp là 1, thì trường này sẽ không tồn tại.
LEN: chiều dài dữ liệu nguồn. Nếu không bằng không, trường này xác định độ dài tính bằng byte của nhiều nguồn dữ liệu được ký bởi hộp chữ ký số này. Một giá trị của không xác định rằng kết thúc của phạm vi dữ liệu nguồn là byte cuối cùng của tập tin. Trường này được mã hóa như là một số nguyên không dấu big endian 8-byte.
DATA: Dữ liệu Chữ ký: Trường này chứa chữ ký số được tạo ra từ nhiều nguồn dữ liệu. Các định dạng của dữ liệu này là theo quy định của trường Styp.
Bảng M.52 – Định dạng nội dung của hộp Chữ ký số
Tham số |
Kích cỡ (bits) |
Giá trị |
Styp |
1 |
0 |
Ptyp |
1 |
0-1 |
OFF |
64 0 |
0-(264-1); nếu Ptyp = 1 không áp dụng; nếu Ptyp = 0 |
LEN |
64 0 |
0-(2b4-1); nếu Ptyp = 1 không áp dụng: nếu Ptyp = 0 |
DATA |
Tùy biến |
Tùy biến |
M.11.18 Hướng ngược XML
Các định dạng tập tin JP2 định nghĩa hộp XML chứa một tài liệu XML đúng định dạng theo quy định của XML 1.0. Trong một tập tin JPX, hộp này được mở rộng để cho phép bộ đọc JPX thực hiện tốt hơn việc sử dụng các dữ liệu XML. Định dạng của hộp XML là không thay đổi. Tuy nhiên, một đầu đọc JPX nên làm những điều sau đây để phân tích các tài liệu XML:
– Nếu bộ đọc tìm thấy thuộc tính “xsi: schemaLocation” trong phần tử gốc, thì cấu trúc của tài liệu XML này hoặc trường hợp dữ liệu là được xác định bởi một sơ đồ. Thuộc tính này xác định vị trí vật lý của tài liệu giản đồ.
– Nếu bộ đọc tìm thấy “! DOCTYPE” dòng trong tiêu đề của tài liệu XML, thì cấu trúc của tài liệu XML hoặc dữ liệu thể hiện là được xác định bởi một tài liệu định nghĩa loại dữ liệu (DTD). Dòng này quy định cụ thể DTD được sử dụng bởi tài liệu này hoặc dữ liệu XML hiện hành, cũng như các tên phần tử gốc và vị trí của DTD.
– Nếu lược đồ XML hay tài liệu DTD được gọi bằng các tài liệu XML chứa trong các hộp XML chứa một trường nhận xét hình thức ”<- HUMAN_SCHEMA_DTD_LOCATION: LOC ->”, thì bộ đọc có thể truy xuất một tài liệu có thể đọc được bởi con người từ URL được chỉ định của LOC. Tài liệu này sẽ bao gồm một mô tả có thể đọc được bởi con người của các giản đồ hay DTD. Tài liệu này sẽ hỗ trợ các nhà phát triển ứng dụng và người sử dụng siêu dữ liệu.
M.11.19 Hướng ngược nhị phân MPEG-7
Hộp này có chứa siêu dữ liệu ở định dạng nhị phân MPEG-7 (BiM) theo quy định của tiêu chuẩn ISO / IEC 15.938.
Loại hộp nhị phân MPEG-7 sẽ là ‘mp7b’ (0x6D70 3762). Nó có thể được tìm thấy bất cứ nơi nào trong tập tin sau các hộp yêu cầu bộ đọc. Nội dung của hộp nhị phân MPEG-7 như sau:
Hình M.40 – Tổ chức các nội dung của một hộp nhị phân MPEG-7
DATA: Dòng MPEG-7 BiM.
M.11.20 Hướng ngược tự do
Hộp miễn phí chỉ định một phần của tập tin hiện thời không được sử dụng và có thể được ghi đè khi chỉnh sửa các tập tin. Bộ đọc sẽ bỏ qua tất cả các hộp miễn phí. Một hộp miễn phí có thể tìm thấy bất cứ nơi nào trong tập tin ngoại trừ trước hộp Yêu cầu bộ đọc.
Các loại hộp miễn phí được ‘miễn phí’ (0x6672 6565). Một hộp miễn phí có chứa dữ liệu vô nghĩa, nội dung của một hộp miễn phí là không xác định.
M.12 Xử lý với hướng ngược chưa biết
Một tập tin JPX phù hợp có thể chứa các hộp không biết các ứng dụng chỉ dựa trên các tiêu chuẩn này. Nếu một bộ đọc phù hợp tìm thấy một hộp mà nó không hiểu, nó sẽ bỏ qua và bỏ qua hộp đó.
M.13 Sử dụng các định dạng tập tin JPX kết hợp với các tiêu chuẩn đa phương tiện khác (thông tin)
Trong khi các tập tin định dạng JPX cung cấp một kiến trúc mạnh mẽ để lưu trữ ảnh, có nhiều ứng dụng trong đó vẫn còn những ảnh được lưu trữ kết hợp với các loại đa phương tiện khác. Ví dụ, nhiều máy ảnh kỹ thuật số vẫn cho phép người sử dụng nắm bắt một chú thích âm thanh để mô tả một bức ảnh cụ thể.
Việc tích hợp này với các loại đa phương tiện khác được hỗ trợ bởi việc sử dụng các cấu trúc Hộp cho đóng gói dữ liệu trong định dạng tập tin JP2 và JPX. Cấu trúc hộp chính nó có định nghĩa nhị phân giống như một nguyên từ QuickTime hoặc nguyên tử MPEG-4. Như vậy, một tập tin có thể được tạo ra bằng cách sử dụng cả hai hộp JPX và Quicktime hoặc MPEG-4. Cung cấp tất cả các offsets trong tập tin là chính xác đối với các vị trí dữ liệu từ đầu của tập tin (và đưa vào tài khoản sự hiện diện của tất cả các hộp và các nguyên tử), một tập tin hai chế độ có thể được tạo ra.
Ví dụ, rất dễ dàng để tạo ra một tập tin có chứa cả một ảnh và một chú thích âm thanh. Các hộp cần thiết để lưu trữ các tập tin ảnh vẫn có thể được kết hợp với các phần tử cần thiết để lưu trữ một tập tin âm thanh MPEG-4 vào một tập tin duy nhất, như MPEG-4, JPX và các định dạng JP2 linh hoạt đối với các vị trí của nhiều hộp quan trọng hoặc nguyên tử. Một bộ ghi tập tin chỉ cần quan tâm rằng các offsets trong hộp và tất cả các nguyên tử được xác định mà chúng trỏ đến vị trí của dữ liệu trong các file kết hợp.
Một bộ đọc chỉ hỗ trợ các định dạng tập tin JPX sẽ xử lý các tập tin như một bức ảnh. Một bộ đọc mà chỉ hỗ trợ chuẩn âm thanh MPEG-4 sẽ xử lý các tập tin như là một tập tin âm thanh. Một bộ đọc có hỗ trợ cả hai tiêu chuẩn trên có thể cung cấp các tính năng tiên tiến bằng cách kết hợp khả năng chụp ảnh với khả năng âm thanh.
Phụ lục N
(Quy định)
Định nghĩa và cú pháp siêu dữ liệu mở rộng định dạng tập tin JPX
(Phụ lục là phần tích hợp với tiêu chuẩn)
Phụ lục này định nghĩa một thiết lập toàn diện của các yếu tố siêu dữ liệu có thể được nhúng vào trong một tập tin JPX trong các hộp XML. Sử dụng hình thức này của siêu dữ liệu là tùy chọn. Siêu dữ liệu được mã hóa theo phụ lục này sẽ được diễn giải một cách chính xác một trong hai hoặc bị bỏ qua bởi một đầu đọc JPX.
N.1 Giới thiệu siêu dữ liệu mở rộng
Siêu dữ liệu là thông tin bổ sung kết hợp với dữ liệu sơ cấp (ảnh). Trong ngữ cảnh của tiêu chuẩn này, đó là dữ liệu bổ sung liên kết với dữ liệu ảnh ngoài các điểm ảnh “Pixels” xác định ảnh. Siêu dữ liệu có thể đánh giá được đối với ảnh của các chủ sở hữu hoặc người sử dụng, cần phải được duy trì nhất quán thông qua chu kỳ sống của ảnh. Trong môi trường ứng dụng biên tập ảnh ngày nay, truyền dẫn phát triển nhanh thông qua mạng Intermet và các máy in đồ họa chất lượng cao, thì chu kỳ sống của ảnh số rất dài cũng như phức tạp.
Siêu dữ liệu ảnh là một khối ảnh số có thể được sử dụng trong vùng phổ rộng của luồng ảnh. Phụ lục này xác định bộ tiêu chuẩn siêu dữ liệu ảnh trên cơ sở nhận thức chung ở đó có thể được phân chia thành các nhóm siêu dữ liệu theo quan niệm. Mỗi nhóm này sẽ mô tả duy nhất một khía cạnh của ảnh. Do siêu dữ liệu phân chia thành các nhóm rời rạc, nên người sử dụng có thể mở rộng một khối riêng mà không làm ảnh hưởng tới cấu trúc thực thể, do đó bảo đảm màu sắc có tính tương tác trong khi cho phép những màu sắc khác bổ sung giá trị vào siêu dữ liệu và chính dữ liệu ảnh.
N.2 Các tham chiếu bổ sung cho siêu dữ liệu mở rộng
– ASTM E1708-95: StVÀard Practice fHoặc Electronic Interchange of ColHoặc VÀ Appearance Data, 1995.
– DIG. DIG35 Specnếuication: Siêu dữ liệu fHoặc Digital Images. Version 1.0, August 2000.
– DIG: Flashpix digital image file fHoặcmat. Version 1.0.1, 10 July 1997.
– IETF RFC 1766: Tags fHoặc the Nhận biết of Languages, March 1995.
– IETF RFC 2396: UnnếuHoặcm Resource Identnếuiers (URI): Generic syntax, August 1998.
– IETF RFC 2426: vCard MIME DirectHoặcy Profile, September 1998.
– ISO 12232:1998, Photography – Electronic still-picture cameras – Determination of ISO speed.
– ISO 12233:2000, Photography-Electronic still-picture cameras – Resolution measurements.
– ISO 12234-2:2001, Electronic still-picture imaging – Removable memHoặcy – Part 2: TNẾUF/EP image data fHoặcmat.
– ISO 14524:1999, Photography – Electronic still-picture cameras – Methods fHoặc measuring opto-electronic conversion functions (OECFs).
– JEIDA: Digital still Camera File FHoặcmat StVÀard (Exnếu). Version 2.1, June 1998.
– DENKER (JOHN S.): See How It Files, 1996.
– NMEA 0183: StVÀard FHoặc Interfacing Marine Electronic Devices. Version 2.30, March 1998.
– WIPO. Berne Convention fHoặc the Protection of Literary VÀ Artistic VVHoặcks. Paris Act of 24 July 1971, amended 28 September 1979.
– WIPO. WHoặcld Intellectual Property Hoặcganization Copyright Treaty, 1996.
– W3C, XML Schema Part 1: Structures, Rec-xmlschema-1 -20010502, <http://www.w3.Hoặcg/TR/ xmlschema-1>.
– W3C, XML Schema Part 2: Datatypes, Rec-xmlschema-2-20010502, <http://www.w3.Hoặcg/TR/ xmlschema-2>.
N.3 Phạm vi định nghĩa siêu dữ liệu
Phụ lục này bao gồm năm nhóm logic của siêu dữ liệu cũng như định nghĩa chung của các dạng dữ liệu có liên quan tới các định nghĩa siêu dữ liệu khác. Trong khi mỗi nhóm được phân chia một cách hợp lý, chúng có thể được liên kết với nhau dưới dạng các ngữ nghĩa bổ sung.
N.3.1 Siêu dữ liệu tạo ảnh
Siêu dữ liệu tạo ảnh xác định “làm thế nào” siêu dữ liệu xác định nguồn gốc của ảnh đă được tạo ra. Ví dụ, thông tin về máy ảnh, các ống kính và điều kiện chụp là thông tin kỹ thuật hữu ích cho các nhiếp ảnh gia chuyên nghiệp và nghiệp dư nghiêm túc cũng như các ứng dụng chụp ảnh nâng cao.
N.3.2 Siêu dữ liệu mô tả nội dung
Siêu dữ liệu mô tả nội dung xác định các thông tin mô tả của khía cạnh “người”, “cái gì”, “khi nào,” và “ở đâu” của ảnh. Thường thì siêu dữ liệu này có dạng các từ, cụm tử, hoặc câu bao quát để mô tả một sự kiện cụ thể hoặc vị trí mà ảnh minh họa. Điển hình, siêu dữ liệu này bao gồm văn bản mà người dùng nhập vào, hoặc khi những ảnh được chụp hoặc quét hoặc hậu kì trong quá trình thao tác hoặc sử dụng các ảnh.
N.3.3 Siêu dữ liệu lịch sử
Lịch sử được sử dụng để cung cấp phần thông tin về cách thức ảnh đạt đến trạng thái hiện tại. Ví dụ, lịch sử có thể bao gồm các bước xử lý nhất định đã được áp dụng cho một ảnh. Một ví dụ khác của một lịch sử sẽ là sự kiện tạo ra ảnh bao gồm chụp kỹ thuật số, sự phơi sáng của bộ phim âm bản hoặc đảo ngược, tạo ra các bản in, quét có thể truyền được của phim âm bản hoặc dương bản, hoặc quét phản chiếu của bản in. Tất cả các siêu dữ liệu này là quan trọng đối với một số ứng dụng. Để cho phép sự linh hoạt trong xây dựng các siêu dữ liệu lịch sử ảnh, hai đại diện xen kẽ của lịch sử được cho phép. Trong lần đầu tiên, các siêu dữ liệu lịch sử được nhúng vào trong các siêu dữ liệu ảnh. Trong lần thứ hai, các phiên bản trước của ảnh, đại diện như một URL/URI, được bao gồm trong các siêu dữ liệu lịch sử như là các gợi ý đến vị trí của lịch sử thực tế. Các siêu dữ liệu lịch sử cho một ảnh tổng hợp (ví dụ, tạo ra từ hai hoặc nhiều ảnh trước đó) cũng có thể được thể hiện qua một cấu trúc siêu dữ liệu phân cấp. Trong khi chỉ dẫn kỹ thuật này không xác định “làm thế nào” hay “bao nhiêu” phần của các khía cạnh xử lý, nó cho phép ghi lại các bước xử lý nhất định được áp dụng cho một ảnh như các chỉ dẫn để sử dụng trong tương lai.
N.3.4 Siêu dữ liệu quyền sở hữu trí tuệ
Siêu dữ liệu Quyền sở hữu trí tuệ (IPR) định nghĩa siêu dữ liệu để bảo vệ các quyền lợi của chủ sở hữu ảnh hoặc cung cấp thêm thông tin để yêu cầu sự cho phép sử dụng nó. Điều quan trọng là các nhà phát triển và người dùng có thể hiểu được ý nghĩa của sở hữu trí tuệ và thông tin bản quyền trong ảnh kỹ thuật số để bảo vệ đúng cách các quyền của chủ sở hữu dữ liệu ảnh.
N.3.5 Các loại và phần tử siêu dữ liệu cơ bản
Các loại siêu dữ liệu cơ bản xác định các kiểu dữ liệu phổ biến mà có thể được sử dụng trong mỗi nhóm siêu dữ liệu. Chúng bao gồm một loại địa chỉ hoặc một loại nhân bản là một bộ tập hợp các kiều dữ liệu nguyên thủy khác. Các phần tử siêu dữ liệu cơ bản xác định các yếu tố thường được tham khảo trong các nhóm dữ liệu khác. Chúng bao gồm một định nghĩa cho đặc tả ngôn ngữ và một dấu thời gian.
N.3.6 Siêu dữ liệu nhận dạng ảnh
Siêu dữ liệu nhận dạng ảnh sử dụng để nhận dạng ảnh duy nhất.
N.4 Cú pháp siêu dữ liệu
Theo định nghĩa trong ITU-T T.800 | ISO/IEC 15444-1 Phụ lục I, định dạng tập tin JP2 cho phép siêu dữ liệu định dạng XML được chứa trong các cấu trúc hộp. Siêu dữ liệu được xác định bởi phụ lục này sẽ được đúng định dạng XML được xác định bởi XML 1.0. XML phải phù hợp với tất cả các yêu cầu bắt buộc của N.6, không chỉ được nói rõ trong DTD và Lược đồ XML. Mã hóa ký tự mặc định sẽ là UTF-8 trừ trường hợp quy định tại các tài liệu XML.
N.4.1 Ngôn ngữ định nghĩa sơ đồ siêu dữ liệu
Tiêu chuẩn sử dụng cú pháp sơ đồ XML được xác định bởi sơ đồ XML phần 1 và sơ đồ XML phần 2 đề mô tả các thành phần của siêu dữ liệu.
N.4.2 Không gian tên
Không gian tên XML là một tập hợp của các tên, xác định bởi một Định dạng tài nguyên phổ biến (URI), cho phép các tài liệu XML của các nguồn khác nhau sử dụng các yếu tố với các tên gọi giống nhau, được sáp nhập trong một tài liệu duy nhất không có sự nhầm lẫn. Xét siêu dữ liệu JPX, hoặc kết hợp các siêu dữ liệu khác cho khả năng mở rộng hoặc được sử dụng trong các ứng dụng khác, điều quan trọng là xác định một không gian tên XML cho các thành phần JPX và các thuộc tính. Để xác định không gian tên JPX XML, URI sau đây được xác định.
Các không gian tên sau đây được sử dụng để xác định các thành phần, thuộc tính và các giá trị XML và Sơ đồ XML:
N.4.3 Thông tin xác định loại tài liệu
Một định nghĩa kiểu tài liệu (DTD) XML cho Tiêu chuẩn này được xác định bởi DTD quy định tại N.8.
Các định danh công cộng chính thức (FPI) cho DTD này là:
FPI này được sử dụng trên tuyên bố DOCTYPE trong một tài liệu XML tham chiếu DTD được định nghĩa bởi Tiêu chuẩn này.
URL sau đây tham khảo DTD cho Tiêu chuẩn này:
Trong siêu dữ liệu được xác định bởi phụ lục này, một tuyên bố DOCTYPE sẽ hiện diện trước phần tử gốc của tài liệu XML. Tên trong tuyên bố DOCTYPE được thành lập với tên phần tử gốc cho các hộp được xác định trong N.5. Hệ thống nhận dạng có thể được sửa đổi một cách thích hợp để tham khảo các DTD thể hiện trong N.8.
N.4.4 Thông tin sơ đồ XML
Một lược đồ XML cho Tiêu chuẩn này được định nghĩa bởi sơ đồ XML quy định tại N.9.
URL sau đây tham khảo sơ đồ XML cho Tiêu chuẩn này:
Trường hợp vị trí lược đồ XML được sử dụng trong siêu dữ liệu được xác định bởi phụ lục này, các phần tử gốc phải có một thuộc tính xskschemaLocation liệt kê các tên miền không gian jp theo quy định tại N.4.2 và tài liệu tham khảo URL phù hợp của tập tin sơ đồ XML thể hiện trong N.9.
N.5 Các hướng ngược đã xác định
Các hộp sau đây được định nghĩa như là một phần của siêu dữ liệu định dạng tập tin JPX mở rộng. Tất cả các hộp được xác định trong phụ lục này là tùy chọn trừ khi có quy định khác. Một đầu đọc JPX hỗ trợ siêu dữ liệu quy định tại phụ lục này sẽ hiểu được tất cả các thành phần trong mỗi hộp.
N.5.1 Hướng ngược siêu dữ liệu tạo ảnh
Hộp siêu dữ liệu tạo ảnh định nghĩa siêu dữ liệu có liên quan đến việc tạo ra một ảnh kỹ thuật số. Phạm vi của các hộp này được áp dụng cho các thành phần siêu dữ liệu có liên quan đến việc tạo ra các dữ liệu ảnh kỹ thuật số, ví dụ, thông tin máy ảnh và thiết bị máy quét và điều kiện chụp của nó cũng như các phần mềm hoặc phần mềm nhúng để tạo ra ảnh như vậy. Nó định nghĩa “làm thế nào” mà siêu dữ liệu xác định nguồn gốc của ảnh.
Các loại hộp Sự tạo ảnh sẽ là ‘xml\040’ (0x786D 6C20) theo quy định tại ITU-T T.800 | ISO | IEC 15444-1,1.7.1. Nội dung của hộp này được thực hiện như sau:
Hình N.1 – Tổ chức các nội dung của hộp tạo ảnh
ICre: Trường siêu dữ liệu tạo ảnh. Trường này sẽ được đúng định dạng XML được xác định bởi XML
Bảng N.1 – Định dạng các nội dung của hộp tạo ảnh
Tên trường |
Kích thước (bits) |
Giá trị |
ICre |
Biến thiên |
Trường này chứa một tài liệu XML theo quy định tại N.4, với phần tử gốc IMAGE_CREATION, có chứa siêu dữ liệu quy định tại N.6.1. |
N.5.2 Hướng ngược siêu dữ liệu mô tả nội dung
Hộp này bao gồm các mô tả nội dung của một ảnh. Việc mô tả nội dung có hai mục đích chính:
– Thứ nhất: Nó có thể được sử dụng để phân loại ảnh. Ảnh được đặt trong một cơ sở dữ liệu cần phải được tách từ cơ sở dữ liệu đó. Đối với bất kỳ ảnh trở nên có ích (những ảnh chụp nhanh vui vẻ được lưu trong hệ thống tập tin của một máy tính cá nhân thông qua một thư viện ảnh chuyên nghiệp mở rộng), điều này là cần thiết. Sự phân loại này có thể được sử dụng để tìm kiếm ảnh.
– Thứ hai: Khi một ảnh được lấy ra, có thể bao gồm một số dữ liệu trong đó mô tả ảnh, nhưng không phải là hữu ích khi tìm kiếm. Ví dụ: – “Bob là anh chàng đang ngủ trên ghế dài” không phải tất cả đều hữu ích khi tìm kiếm, nhưng hữu ích khi mô tả nội dung.
Các siêu dữ liệu được liệt kê trong hộp này chứa dữ liệu cho cả hai trường hợp trên.
Các chủng loại của hộp mô tả nội dung là ‘xml\040’ (0x786D 6C20) theo quy định tại ITU-T T.800 I ISO/IEC 15444 1,1.7.1. Nội dung của hộp này như sau:
Hình N.2 – Tổ chức các nội dung của hộp mô tả nội dung
CDes: Trường mô tả nội dung. Trường này sẽ được đúng định dạng XML được xác định bởi XML 1.0.
Bảng N.2 – Định dạng các nội dung của hộp mô tả nội dung
Tên trường |
Kích thước (bits) |
Giá trị |
CDes |
Biến thiên |
Trường này chứa một tài liệu XML theo quy định tại N.4, với phần tử gốc CONTENT_DESCRIPTION, có chứa siêu dữ liệu quy định tại N.6.2. |
N.5.3 Hướng ngược lịch sử
Hộp này có chứa lịch sử siêu dữ liệu của một ảnh. Siêu dữ liệu lịch sử được sử dụng để cung cấp một phần thông tin về cách ảnh đã đến trạng thái hiện tại. Những thông tin này chỉ là gần đúng vì:
– một số dữ liệu được thu gọn, do đó chỉ cung cấp một bản tóm tắt;
– một số dữ liệu có thể không được nhập đúng bởi vì các ứng dụng được sử dụng không thể cập nhật các siêu dữ liệu lịch sử.
Hộp lịch sử có chứa một bản tóm tắt các hoạt động chỉnh sửa ảnh cơ bản mà đã được áp dụng cho ảnh và (các) phiên bản trước đó của siêu dữ liệu ảnh. Siêu dữ liệu lịch sử không được thiết kế để được sử dụng để đảo ngược (hoàn tác) hoạt động chỉnh sửa ảnh.
Các loại hộp lịch sử sẽ là ‘xml\040’ (0x786D 6C20) theo quy định tại ITU-T T.800 | ISO/IEC 15444-1, 1.7.1. Nội dung của hộp này như sau:
Hình N.3 – Tổ chức nội dung của hộp lịch sử
Hist: Trường lịch sử. Trường này sẽ được đúng định dạng XML được xác định bởi XML 1.0.
Bảng N.3 – Định dạng nội dung của hộp lịch sử
Tên trường |
Kích thước (bits) |
Giá trị |
MHist | Biến thiên | Trường này chứa một tài liệu XML theo quy định tại N.4, với phần tử gốc HISTHOẶCY, có chứa siêu dữ liệu quy định tại N.6.3. |
N.5.4 Hướng ngược quyền sở hữu trí tuệ
Hộp này có chứa các thông tin liên quan quyền sở hữu trí tuệ (IPR) gắn liền với ảnh chẳng hạn như quyền nhân thân, quyền tác giả cũng như việc khai thác thông tin.
Các loại hộp quyền sở hữu trí tuệ sẽ là ‘jp2i’ (0x6A70 3269) theo quy định tại ITU-T T.800 | ISO/IEC 15444-1, I.6. Nội dung của hộp này như sau:
Hình N.4 – Tổ chức nội dung của hộp quyền sở hữu trí tuệ
IPR: Trường quyền sở hữu trí tuệ. Trường này sẽ được định dạng đúng XML được xác định bởi XML 1.0.
Bảng N.4 – Định dạng nội dung của hộp quyền sở hữu trí tuệ
Tên trường |
Kích thước (bits) |
Giá trị |
IPR |
Biến thiên |
Trường này chứa một tài liệu XML theo quy định tại N.4, với phần tử gốc IPR, có chứa siêu dữ liệu quy định tại N.6.4. |
N.5.5 Hướng ngược nhận dạng ảnh
Hộp này có chứa siêu dữ liệu nhận dạng ảnh của một ảnh. Siêu dữ liệu nhận dạng ảnh nhận được sử dụng để nhận diện duy nhất ảnh.
Các loại hộp nhận dạng ảnh sẽ là ‘xml\040’ (0x786D 6C20) theo quy định tại ITU-T T.800 | ISO/IEC 15444-1,1.7.1. Nội dung của hộp này như sau:
Hình N.5 – Tổ chức nội dung của hộp nhận dạng ảnh
Imgld: Trường nhận dạng ảnh. Trường này sẽ được định dạng đúng XML được xác định bởi XML 1.0
Bảng N.5 – Định dạng nội dung của hộp nhận dạng ảnh
Tên trường |
Kích thước (bits) |
Giá trị |
Imgld |
Biến thiên |
Trường này chứa một tài liệu XML theo quy định tại N.4, với phần tử gốc IMAGEJD, có chứa siêu dữ liệu quy định tại N.6.5. |
N.6 Các định nghĩa siêu dữ liệu
Mục này quy định cụ thể cú pháp và ngữ nghĩa các thành phần siêu dữ liệu được định nghĩa như là một phần của siêu dữ liệu định dạng tập tin JPX mở rộng. Mỗi một trong số các thành phần siêu dữ liệu sau đây được dựa trên định dạng XML như định nghĩa trong XML 1.0. Siêu dữ liệu được diễn giải một cách chính xác hoặc bị bỏ qua bởi một đầu đọc JPX.
N.6.1 Siêu dữ liệu tạo ảnh
Thành phần này chỉ thông tin thích hợp với việc tạo ra các tập tin ảnh. Thành phần này có thể chứa các phần tử được liệt kê dưới đây.
Hình N.6 – Sơ đồ của siêu dữ liệu tạo ảnh
GENERAL_CREATION_INFO: | Thông tin việc tạo ra tổng quan. Yếu tố này chỉ thông tin tổng quan về cách ảnh đã được tạo ra. Cú pháp của yếu tố này được quy định tại N.6.1.1. |
CAMERA_CAPTURE: | Yếu tố này chỉ một siêu dữ liệu máy ảnh chụp của một cảnh. Cú pháp của yếu tố này được quy định tại N.6.1.2. |
SCANNER: | Yếu tố này chỉ siêu dữ liệu máy quét chụp có thể được sử dụng cho các máy quét khác nhau như phẳng và máy quét phim. Cú pháp của yếu tố này được quy định tại N.6.1.8. |
SOFTWARE CREATION: | Yếu tố này chỉ thông tin phần mềm đã tạo ra các ảnh kỹ thuật số ban đầu. Cú pháp của yếu tố này được quy định tại N.6.1.10. |
CAPTURED_MỤC: | Yếu tố này chứa mô tả của các mục mà đã được chụp kỹ thuật số. Cú pháp của yếu tố này được quy định tại N.6.1.11. |
N.6.1.1 Siêu dữ liệu tạo thông tin chung
Yếu tố này chỉ thông tin tổng quan về cách thức ảnh được tạo ra. Các ứng dụng có thể lựa chọn để bỏ qua tiếp tục phân tích dựa trên các giá trị được lưu trữ ở đây. Ví dụ, nếu ứng dụng chỉ quan tâm siêu dữ liệu máy ảnh kỹ thuật số, nó có thể bỏ qua phân tích bổ sung dựa trên các giá trị nguồn ảnh. Yếu tố này có thể chứa các phần tử được liệt kê dưới đây.
Hình N.7 – Sơ đồ của siêu dữ liệu thông tin tạo ra tổng quan
CREATION_TIME: | Yếu tố này xác định ngày và thời gian ảnh được tạo ra. Yếu tố này nên được lưu trữ khi quá trình tạo bắt đầu. (Ví dụ, nó có thể là 8 phút phơi sáng). Yếu tố này không bao giờ được thay đổi sau khi nó được viết bằng các thiết bị tạo ra ảnh. |
IMAGE_SOURCE: | Yếu tố này quy định nguồn thiết bị của các tập tin kỹ thuật số, chẳng hạn như một máy quét phim, máy quét in phản chiếu, hoặc máy ảnh kỹ thuật số. Bảng N.6 liệt kê các giá trị đề nghị cho yếu tố này. |
Bảng N.6 – Các giá trị nguồn gốc ảnh
Giá trị |
Ý nghĩa |
Máy ảnh kĩ thuật số | Tạo ra ảnh bằng máy ảnh kĩ thuật số |
Máy quét phim | Tạo ra ảnh bằng máy quét phim |
Máy quét in phản chiếu | Tạo ra ảnh bằng máy quét in phản chiếu (thường được gọi là giường phẳng) |
Vẫn từ video | Tạo ra ảnh từ video |
Đồ họa máy tính | Ảnh kỹ thuật số được tạo ra trên máy tính |
SCENE_TYPE | Yếu tố này quy định các loại cảnh đó đã được chụp. Nó phân biệt “những cảnh gốc” (chụp trực tiếp cảnh thực tế) từ “những cảnh tạo ra thứ hai” (ảnh được chụp từ ảnh bản cứng có sẵn). Nó cung cấp sự khác biệt hơn nữa cho những cảnh được tạo ra bằng kỹ thuật số. Bảng N.7 liệt kê các giá trị đề nghị cho yếu tố này. |
Bảng N.7 – Các giá trị chủng loại cảnh
Giá trị |
Ý nghĩa |
Cảnh gốc | Chụp trực tiếp cảnh thực tế |
Cảnh tạo ra thứ hai | Tạo ra ảnh bằng máy quét phim |
Tạo ra cảnh kĩ thuật số | Ảnh được chụp từ ảnh bản cứng có sẵn từ trước như một đoạn văn. |
IMAGE_CREATHOẶC: | Yếu tố này chỉ định tên của tác giả ảnh. Các tác giả ảnh có thể được, ví dụ, nhiếp ảnh gia đã chụp được ảnh gốc trên phim, người vẽ tranh minh họa, hoặc nghệ sĩ đồ họa thực hiện quá trình tạo ảnh, vv. Xem loại người (N.7.1.13) cho các định dạng của các yếu tố này. |
OPERATHOẶC_HOẶCG: | Người điều hành tổ chức. Yếu tố này chỉ định tên của cục dịch vụ, người làm hậu kì, hoặc tổ chức nơi mà quá trình chụp ảnh (chụp, quét hoặc được tạo ra bởi phần mềm) được tiến hành. Xem loại Tổ chức (N.7.1.14) cho các định dạng của yếu tố này. |
OPERATHOẶC_ID: | Yếu tố này chỉ định một tên hoặc ID cho người thực hiện quá trình chụp. |
N.6.1.2 Siêu dữ liệu chụp ảnh
Yếu tố này chỉ định một máy ảnh chụp của một cảnh. Yếu tố này có thể chứa thông tin máy ảnh và ống kính, đặc tính thiết bị và các thiết lập máy ảnh chụp.
Hình N.8 – Sơ đồ của siêu dữ liệu máy ảnh chụp
LENS INFO: | Thông tin máy ảnh. Yếu tố này chỉ rõ thông tin của máy ảnh đã chụp ảnh. Xem lại chi tiết sản phẩm (N.7.1.21) cho các định dạng của yếu tố này. |
SOFTWAREINFO: | Thông tin phần mềm. Yếu tố này chỉ thông tin về các phần mềm hoặc phần mềm nhúng sử dụng để chụp ảnh. Xem loại chi tiết sản phẩm (N.7.1.21) cho các định dạng của yếu tố này. |
CAMERA INFO: | Thông tin ống kính. Yếu tố này chỉ thông tin về các ống kính chụp ảnh. Xem loại chi tiết sản phẩm (N.7.1.21) cho các định dạng của yếu tố này. |
DEVICE CHARACTER: | Đặc tính thiết bị. Yếu tố này quy định các đặc tính kỹ thuật của thiết bị chụp kỹ thuật số. Cú pháp của yếu tố này được quy định tại N.6.1.3. |
CAMERA_SETTINGS: | Các thiết lập máy ảnh chụp. Yếu tố này quy định các cài đặt máy ảnh sử dụng khi ảnh được chụp. Cú pháp của yếu tố này được quy định tại N.6.1.7. |
ACCESSHOẬCY: | Yếu tố này quy định các thông tin của các phụ kiện được sử dụng với máy ảnh để chụp ảnh. Các nhiếp ảnh gia chuyên nghiệp và nghiệp dư có thể muốn giữ một loạt các thông tin kỹ thuật linh tinh, chẳng hạn như việc sử dụng các ống mở rộng, ống thổi, ống kính cận cảnh, và các phụ kiện chuyên ngành khác. Xem loại chi tiết sản phẩm (N.7.1.21) cho các định dạng của yếu tố này. |
N.6.1.3 Siêu dữ liệu đặc tính thiết bị
Yếu tố này quy định các đặc tính kỹ thuật của thiết bị chụp kỹ thuật số. Yếu tố này có thể chứa các phần tử được liệt kê dưới đây.
Hình N.9 – Sơ đồ của siêu dữ liệu đặc tính thiết bị
SENSHOẶC_TECHNOLOGY | Yếu tố này chỉ rõ một trong hai loại cảm biến ảnh hoặc các phương pháp cảm biến được sử dụng trong các máy ảnh hoặc thiết bị ảnh chụp. Bảng N.8 liệt kê các giá trị đề nghị cho yếu tố này. |
Bảng N.8 – Các giá trị công nghệ cảm biến
Giá trị |
Ý nghĩa |
Vùng màu trong một chip điều khiển | Công nghệ cảm biến vùng màu trong một chip điều khiển được sử dụng |
Vùng màu trong hai chip điều khiển | Công nghệ cảm biến vùng màu trong hai chip điều khiển được sử dụng |
Vùng màu trong ba chip điều khiển | Công nghệ cảm biến vùng màu trong ba chip điều khiển được sử dụng |
Vùng màu liên tiếp | Công nghệ cảm biến vùng màu liên tiếp được sử dụng |
Tam tuyến | Công nghệ cảm biến tam tuyến được sử dụng |
Cảm biến tuyến tính màu liên tiếp | Công nghệ cả biến tuyến tính màu liên tiếp được sử dụng. |
FOCAL_PLANE_RES: | Độ phân giải mặt phẳng tiêu cự. Yếu tố này quy định cụ thể số lượng điểm ảnh trên mỗi mét trong X (chiều rộng) và Y (chiều cao) phương hướng cho ảnh chính. Độ phân giải được lưu trữ là độ phân giải của ảnh được tạo ra chứ không phải là chiều rộng và chiều cao của cảm biến ảnh. |
SPECTRAL_SENSITIVITY: | Yếu tố này chỉ độ nhạy quang phổ của mỗi kênh của máy ảnh sử dụng để chụp ảnh. Nó rất hữu ích cho các ứng dụng khoa học nhất định. Nội dung của nguyên tố này tương thích với ASMT E1708- 95 và dự kiến sẽ được xác định bởi các tiêu chuẩn khác. Nếu dữ liệu độ nhạy quang phổ có chứa các kí tự “<” hoặc sau đó tất cả các lần xuất hiện của “<” sẽ được thay thế bằng “& It;” và sẽ đưực thay thế bằng “& amp;”. |
ISO_SATURATION: | Hiệu suất tốc độ bão hòa ISO. Yếu tố này xác định việc phân loại hiệu suất tốc độ bão hòa ISO theo quy định tại ISO 12232. |
ISO_NOISE: | Hiệu suất tốc độ tiếng ồn ISO. Yếu tố này xác định việc phân loại hiệu suất tốc độ tiếng ồn ISO theo quy định tại ISO 12232. |
SPATIAL_FREQ_RESPONSE: | Đáp ứng tần số không gian. Yếu tố này xác định các Đáp ứng tần số không gian (SFR) của thiết bị chụp ảnh. Cú pháp của yếu tố này được chỉ rõ tại N.6.1.4. |
CFA_PATTERN: | Mô hình ma trận lọc màu. Yếu tố này xác định mô hình ma trận lọc màu (CFA) của cảm biến ảnh được sử dụng để chụp một ảnh màu cảm biến đơn. Cú pháp của yếu tố này được chỉ rõ tại N.6.1.5. |
OECF: | Chức năng biến đổi quang điện tử. Yếu tố này xác định chức năng biến đổi quang điện tử (OECF). OECF là mối quan hệ giữa đầu vào quang học và các đầu ra giá trị mã hóa tệp tin ảnh của một máy ảnh điện tử. Đặc tính này cho phép các giá trị OECF được định nghĩa trong ISO 14524 được lưu trữ trong một bảng giá trị. Cú pháp của yếu tố này được chỉ rõ tại N.6.1.6. |
MIN_F_NUMBER: | Trị số khẩu độ (F-number) tối thiểu. Yếu tố này quy định trị số khẩu độ ống kính tối thiểu của máy ảnh hoặc thiết bị chụp ảnh |
N.6.1.4 Siêu dữ liệu đáp ứng tần số không gian
Phần này quy định cụ thể Đáp ứng tần số không gian (SFR) của thiết bị chụp ảnh. Các thiết bị đo dữ liệu SFR, được mô tả trong ISO 12233, có thể được lưu trữ như là một bảng tần số không gian, các giá trị SFR theo chiều ngang, các giá trị SFR theo chiều dọc, và các giá trị SFR theo đường chéo.
Hình N.10 – Sơ đồ của siêu dữ liệu đáp ứng tần số không gian
SPATIAL FREQVAL: | Giá trị tần số không gian. Yếu tố này xác định danh sách các giá trị SFR. |
SPATIAL_FREQ: | Giá trị tần số không gian trong đường chiều rộng mỗi đơn vị chiều cao ảnh. |
HORIZ_SFR: | Giá trị SFR theo chiều ngang. |
VERT SFR: | Giá trị SFR theo chiều dọc. |
N.6.1.5 Siêu dữ liệu dạng ma trận lọc màu
Yếu tố này mã hóa mô hình hình học thực tế ma trận lọc màu (CFA) của cảm biến ảnh được sử dụng để chụp một ảnh màu cảm biến đơn. Nó không phù hợp cho tất cả các phương pháp cảm biến. Dữ liệu chứa số lượng tối thiểu của các hàng và cột của các giá trị màu lọc xác định duy nhất ma trận lọc màu.
Hình N.11 – Sơ đồ của siêu dữ liệu mô hình ma trận lọc màu
COLHOẶC_ROW: | Yếu tố này xác định danh sách các giá trị màu của mô hình CFA |
COLHOẶC: | Các giá trị mô hình CFA. Các giá trị sẽ là đỏ, xanh lá, xanh nước biển, xanh lam, hồng sẫm, vàng hoặc trắng. |
N.6.1.6 Siêu dữ liệu chức năng biến đổi quang – điện tử
Yếu tố này xác định chức năng biến đổi quang điện tử (OECF). OECF là mối quan hệ giữa đầu vào quang học và các đầu ra giá trị mã hóa tệp tin ảnh của một máy ảnh điện tử. Đặc tính này cho phép các giá trị OECF được định nghĩa trong ISO 14524 được lưu trữ trong một bảng giá trị.
Hình N.12 – Sơ đồ của siêu dữ liệu chức năng biến đổi quang điện tử
LOG_VAL: | Yếu tố này xác định danh sách các giá trị OECF. |
LOG_EXPOSURE: | Đầu vào quang học ghi lại giá trị phơi sáng. |
OUTPUT LEVEL: | Giá trị đầu ra mã hóa tệp tin ảnh. |
N.6.1.7 Siêu dữ liệu thiết lập chụp ảnh
Yếu tố này xác định các cài đặt máy ảnh được sử dụng khi ảnh được chụp. Các tạo ra mới của máy ảnh kỹ thuật số và máy ảnh phim làm cho nó có thể để bắt thêm thông tin về các điều kiện theo đó một bức ảnh được chụp. Điều này có thể bao gồm thông tin về khẩu độ ống kính và thời gian phơi sáng, cho dù đèn chớp đã được sử dụng, ống kính nào đã được sử dụng, vv. Những thông tin kỹ thuật này rất hữu ích cho các nhiếp ảnh gia chuyên nghiệp và nghiệp dư nghiêm túc. Ngoài ra, một số đặc tính này rất hữu ích cho các ứng dụng cơ sở dữ liệu ảnh cho lưu giữ giá trị hữu ích cho các ứng dụng ảnh nâng cao và các thuật toán cũng như phân tích và phục hồi ảnh. Yếu tố này cò thể chứa các phần tử được liệt kê dưới đây.
Hình N.13 – Sơ đồ của siêu dữ liệu các thiết lập chụp của máy ảnh
EXP TIME: | Thời gian phơi sáng. Yếu tố này xác định thời gian phơi sáng được dùng khi ảnh được chụp. Giá trị của yếu tố này được lưu trữ trong vài giây. |
R_EXP TIME: | Thời gian phơi sáng hợp lý. Yếu tố này xác định cụ thể thời gian phơi sáng được dùng khi ảnh được chụp. Giá trị của yếu tố này được lưu trữ trong giá trị hợp lý trong vài giây. |
F_NUMBER: | Trị số khẩu độ. Yếu tố này xác định giá trị khẩu độ ống kính (tỷ lệ của khấu độ ống kính và độ dài tiêu cự) được sử dụng tại thời điểm ảnh được chụp. Bảng N.9 liệt kê các giá trị được đề nghị cho yếu tố này. |
EXP_PROGRAM: | Chương trình phơi sáng. Yếu tố này xác định lớp của chương trình phơi sáng mà máy ảnh sử dụng tại thời điểm ảnh được chụp. Bảng N.9 liệt kê các giá trị được đề nghị cho yếu tố này. |
Bảng N.9 – Các giá trị chương trình phơi sáng
Giá trị |
Ý nghĩa |
Bằng tay | Thiết lập phơi sáng được đặt bằng tay bởi người chụp. |
Chương trình mặc định | Chương trình tự động phơi sáng với mục đích sử dụng chung. |
Ưu tiên khẩu độ | Người dùng lựa chọn khẩu độ và máy ảnh lựa chọn tốc độ màn trập cho việc phơi sáng thích hợp. |
Ưu tiên tốc độ màn trập | Người dùng lựa chọn tốc độ màn trập và máy ảnh lựa chọn khẩu độ cho việc phơi sáng thích hợp. |
Chế độ tạo | Thiết lập độ phơi sáng ảnh hưởng tới việc tăng độ sâu của yếu tố. |
Chế độ hành động | Thiết lập độ phơi sáng ảnh hưởng tới tốc độ màn trập nhanh hơn. |
Chế độ chân dung | Thiết lập độ phơi sáng dành cho những ảnh cận cảnh với phông nền mờ. |
Chế độ phong cảnh | Thiết lập độ phơi sáng dành cho phong cảnh với phông nền có độ nét tốt. |
BRIGHTNESS: | Giá trị độ sáng. Yếu tố này xác định giá trị độ sáng (Bv) đều đặn khi ảnh được chụp, sử dụng đơn vị APEX. Giá trị tối đa dự kiến là khoảng 13.00 tương ứng với một bức ảnh chụp một cảnh tuyết vào một ngày nắng, và giá trị tối thiểu dự kiến là khoảng -3.00 tương ứng với một cảnh đêm. Nếu giá trị được cung cấp bởi thiết bị chụp tượng trưng cho một loạt các giá trị thay vì là một giá trị duy nhất, giá trị tối thiểu và tối đa có thể được chỉ rõ. |
EXPOSURE_BIAS: | Giá trị độ lệch phơi sáng. Yếu tố này xác định độ lệch phơi sáng thực tế (số lượng thừa hay thiếu sáng tương đối với phơi sáng bình thường, được xác định bởi hệ thống phơi sáng của máy ảnh) được sử dụng khi chụp ảnh, sử dụng đơn vị APEX. Giá trị là số lượng các giá trị phơi sáng (dừng). Ví dụ, -1,00 chỉ ra thiếu sáng 1eV (1 dừng), hoặc một nửa phơi sáng bình thường. |
SUBJECT_DISTANCE: | Yếu tố này xác định khoảng cách giữa mặt phẳng nút trước của ống kính và chủ thể mà máy ảnh đang lấy nét. Máy ảnh có thể lấy nét vào một chủ thể trong cảnh mà có thể không phải là chủ thể chính. Khoảng cách chủ thể có thể được xác định bởi một số duy nhất nếu biết giá trị chính xác. Ngoài ra, một loạt các giá trị chỉ ra khoảng cách tối thiểu và tối đa của chủ thể có thể được thiết lập. Giá trị của yếu tố này tính theo mét. |
METERING_MODE: | Yếu tố này xác định các chế độ đo sáng (phương pháp của máy ảnh của không gian tăng các giá trị độ sáng cảnh để xác định độ phơi sáng cảm ứng) được sử dụng khi chụp ảnh. Bảng N.10 liệt kê các giá trị đề nghị cho yếu tố này. |
Bảng N.10 – Các giá trị chế độ đo sáng
Giá trị |
Ý nghĩa |
Trung bình | Chế độ trung bình được sử dụng. |
Đo sáng trung tâm | Chế độ đo sáng trung tâm được sử dụng. |
Đo sáng một điểm | Chế độ đo sáng một điểm được sử dụng. |
Đo sáng đa điểm | Chế độ đo sáng đa điểm được sử dụng. |
Đo sáng kiểu mẫu | Chế độ đo sáng kiểu mẫu được sử dụng. |
Cục bộ | Chế độ cục bộ được sử dụng. |
SCENE_GIÁ TRỊ: | Yếu tố này xác định các nguồn sáng (cảnh rực rỡ) đã xuất hiện khi ảnh được chụp. Bảng N.11 liệt kê các giá trị đề nghị cho yếu tố này. |
Bảng N.11 – Các giá trị cảnh rực rỡ
Giá trị |
Ý nghĩa |
Ánh sáng ban ngày | Ánh sáng ban ngày rực rỡ được sử dụng. |
Ánh sáng huỳnh quang | Ánh sáng huỳnh quang được sử dụng. |
Bóng đèn dây tóc | Bóng đèn dây tóc được sử dụng. |
Đèn chớp | Đèn chớp được sử dụng. |
Tiêu chuẩn soi sáng A | Tiêu chuẩn soi sáng A được sử dụng. |
Tiêu chuẩn soi sáng B | Tiêu chuẩn soi sáng B được sử dụng. |
Tiêu chuẩn soi sáng C | Tiêu chuẩn soi sáng C được sử dụng. |
Soi sáng D55 | 4.6 Soi sáng D55 được sử dụng. |
Soi sáng D65 | Soi sáng D65 được sử dụng. |
Soi sáng D75 | Soi sáng D75 được sử dụng. |
COLHOẶC_TEMP: | Nhiệt độ màu. Yếu tố này xác định giá trị nhiệt độ màu sắc thực tế của soi sáng cảnh được tính theo đơn vị Kelvin. |
FOCAL_LENGTH: | Yếu tố này xác định độ dài tiêu cự ống kính được sử dụng để chụp ảnh. Chiều dài tiêu cự có thể được xác định bằng cách sử dụng một số duy nhất, cho ống kính độ dài tiêu cự cố định hoặc ống kính thu phóng, nếu vị trí thu phóng đã biết. Giá trị của yếu tố này được tính theo mét. |
LASH: | Yếu tố này xác định xem đèn chớp được sử dụng khi chụp ảnh. |
FLASH_ENERGY: | Yếu tố này xác định khoảng năng lượng đèn chớp đã được sử dụng. Các đơn vị đo lường là BCPS. |
FLASH_RETURN : | Yếu tố này xác định máy ảnh đánh giá đèn flash không có hiệu quả ở thời gian phơi sáng. |
BACK_LIGHT: | Yếu tố này xác định đánh giá của máy ảnh về các điều kiện ánh sáng tại thời điểm phơi sáng. Bảng N.12 liệt kê các giá trị BACKJJGHT được sử dụng cho các tình huống ánh sáng. |
Bảng N.12 – Các giá trị ánh sáng ngữ cảnh
Giá trị |
Ý nghĩa |
Ánh sáng phía trước | Chủ thể được chiếu sáng từ phía trước. |
Ánh sáng nền 1 | Chênh lệch giá trị độ sáng giữa chủ thể trung tâm và các vùng xung quanh là lớn hơn so với một bước đầy đủ (APEX). Phần hướng ngược được phơi sáng cho chủ thể trung tâm. |
Ánh sáng nền 2 | Yếu tố này chỉ trạng thái của việc lấy nét của thiết bị chụp tại thời điểm chụp. Bảng N.13 liệt kê các giá trị sử dụng cho tình trạng lấy nét tự động. |
SUBJECT_POSITION: | Yếu tố này xác định vị trí gần đúng của chủ thể trong cảnh. Xem Loại vị trí cho định dạng của yếu tố này. |
EXPOSUREJNDEX: | Yếu tố này xác định thiết lập chỉ số phơi sáng mà máy ảnh dã lựa chọn. |
AUTO_FOCUS: | Yếu tố này xác định trạng thái của sự lấy nét của thiết bị chụp tại thời điểm chụp. Bảng N.13 liệt kê các giá trị sử dụng cho trạng thái tự động lấy nét. |
Bảng N.13 – Các giá trị tự động lấy nét
Giá trị |
Ý nghĩa |
Tự động lấy nét được sử dụng | Máy ảnh đã lấy nét thành công vào chủ thể. |
Tự động lấy nét bị gián đoạn | Ảnh được chụp trước khi máy ảnh lấy nét thành công vào chủ thể. |
Lấy nét gần | Máy ảnh chủ ý lấy nét tại một khoảng cách gần hơn chủ thể để cho phép siêu áp đặt của một đối tượng tiền cảnh được lấy nét. |
Lấy nét nhẹ | Máy ảnh chú ý không lấy nét chính xác ở khoảng cách đối tượng để tạo ra một ảnh mịn hơn (thường được sử dụng cho chân dung). |
Chỉnh bằng tay | Máy ảnh được lấy nét bằng tay. |
SPECIAL_EFFECT: | Hiệu ứng đặc biệt. Yếu tố này xác định các loại bộ lọc hiệu ứng đặc biệt được sử dụng. Nó chứa một danh sách các phần tử lọc, nơi mà thứ tự của các phần tử trong ma trận chỉ ra thứ tự sắp xếp của các bộ lọc. Giá trị đầu tiên trong ma trận là bộ lọc gần nhất với hướng ngược cảnh gốc. Yếu tố này quy định các bộ lọc hiệu ứng đặc biệt được sử dụng. Các giá trị hợp pháp là màu, sự khuếch tán, đa ảnh, phân cực, tách trường, ngôi sao. |
CAMERA_LOCATION: | Yếu tố này xác định vị trí của máy ảnh khi bức ảnh được chụp. Xem loại địa chỉ cho các định dạng của yếu tố này. |
HOẶCIENTATION: | Yếu tố này xác định sự định hướng của máy ảnh khi bức ảnh được chụp. Xem Loại phương hướng cho các định dạng của yếu tố này. |
PAR: | Tỉ lệ in. Yếu tố này xác định tỉ lệ in được xác định bởi người dùng khi bức ảnh được chụp. |
N.6.1.8 Siêu dữ liệu thu giữ ảnh quét
Yếu tố này xác định siêu dữ liệu chụp quét có thể được sử dụng cho các máy quét khác nhau như máy quét phẳng và máy quét phim. Nó chứa tùy chọn thông tin máy quét, đặc tính thiết bị và các thiết lập chụp quét. Yếu tố này có thể chứa các phần từ được liệt kê dưới đây.
Hình N.14 – Sơ đồ cho siêu dữ liệu chụp quét
SCANNER_INFO: | Thông tin máy quét. Yếu tố này xác định thông tin về một máy quét cụ thể được sử dụng để số hóa một ảnh. Nó khuyến cáo rằng các ứng dụng có thể tạo ra một giá trị duy nhất của máy quét bằng cách kết hợp tất cả các yếu tố. Xem loại chi tiết sản phẩm (N.7.1.21) cho định dạng của yếu tố này. |
SOFTWARE_INFO: | Thông tin phần mềm. Yếu tố này xác định thông tin về phần mềm hoặc phần mền nhúng sử dụng để chụp ảnh. Xem loại chi tiết sản phẩm (N.7.1.21) cho định dạng của yếu tố này. |
SCANNER_SETTINGS: | Yếu tố này xác định các thiết lập máy quét sử dụng khi ảnh đã được quét. Cú pháp của yếu tố này được quy định tại N.6.1.9. |
N.6.1.9 Siêu dữ liệu thiết lập ảnh quét
Yếu tố này xác định các thiết lập máy quét sử dụng khi ảnh đã được quét. Yếu tố này có thể chứa các phần tử được liệt kê dưới đây.
Hình N.15 – Sơ đồ cho siêu dữ liệu các thiết lập máy quét
PIXEL_KÍCH THƯỚC: | Yếu tố này xác định kích thước điểm ảnh, tính bằng mét, của máy quét. |
PHYSICAL_SCAN_RES: | Độ phân giải quét vật lý. Những yếu tố xác định độ phân giải quét vật lý của thiết bị (không phải là độ phân giải nội suy của dữ liệu đầu ra cuối cùng) trong các hướng X (chiều rộng) và Y (chiều cao). Giá trị của những yếu tố này tính theo mét. |
N.6.1.10 Siêu dữ liệu tạo phần mềm
Yếu tố này xác định thông tin tạo phần mềm (ví dụ, tên ứng dụng) đã tạo ra ảnh gốc.
SOFTWARE_INFO: | Thông tin phần mềm. Yếu tố này xác định thông tin về phần mềm đã tạo ra ảnh gốc. Xem loại chi tiết sản phẩm (N.7.1.21) cho định dạng của yếu tố này. |
N.6.1.11 Siêu dữ liệu số hạng đã thu giữ
Yếu tố này xác định siêu dữ liệu phần đã chụp. Nó chứa tùy chọn máy in phản chiếu hoặc phim. Yếu tố này có thể chứa các phần tử được liệt kê dưới đây.
Hình N.17 – Sơ đồ của siêu dữ liệu phần đã chụp
REFLECTION_PRINT: | Yếu tố này xác định thông tin về một bản in phản chiếu đã được chụp bắt kỹ thuật số. Cú pháp của yếu tố này được quy định tại N.6.1.12. |
FILM: | Yếu tố này xác định thông tin về phim. Cú pháp của yếu tố này được quy định tại N.6.1.13. |
N.6.1.12 Siêu dữ liệu in ảnh phản chiếu
Yếu tố này xác định thông tin về một bản in phản chiếu đã được chụp bắt kỹ thuật số. Yếu tố này có thể chứa các phần tử được liệt kê dưới đây.
Hình N.18 – Sơ đồ cho siêu dữ liệu in phản chiếu
DOCUMENT_KÍCH THƯỚC: | Yếu tố này xác định độ dài của X (chiều rộng) và Y (chiều cao) kích thước của bức ảnh gốc hoặc tài liệu tương ứng. Các giá trị của các yếu tố này được tính theo mét. |
MEDIUM: | Yếu tố này xác định các phương tiện của bản gốc bức ảnh, tài liệu, hoặc đồ tạo khác. Giá trị hợp pháp bao gồm liên tục ảnh có sắc liên tục, ảnh bán sắc, và đi nét. |
RPTYPE: | Loại in phản chiếu. Yếu tố này xác định loại văn bản gốc hoặc ảnh in. Giá trị hợp pháp bao gồm in đen trắng, in màu, văn bản đen trắng, và văn bản màu. |
N.6.1.13 Siêu dữ liệu phim
Yếu tố này xác định thông tin về phim đã đặc kĩ thuật số hóa. Yếu tố này có thể bao gồm các phần từ được liệt kê dưới đây.
Hình N.19 – Sơ đồ cho siêu dữ liệu phim
BRVÀ: | Yếu tố này xác định cụ thể tên của nhà sản xuất phim. Xem loại chi tiết sản phẩm (N.7.1.21) cho định dạng của yếu tố này. |
CATEGHOẶCY: | Yếu tố này xác định các thể loại của bộ phim được sử dụng. Giá trị hợp pháp bao gồm âm bản đen trắng, âm bản màu, đảo ngược đen trắng, đảo ngược màu, Chromagenic, âm bản trung gian đen trắng, và âm bản trung gian màu. Các thể loại Chromagenic đề cập đến phim âm bản đen trắng được phát triển với một quy trình C41 (ví dụ, hóa học âm bản màu). |
FILM_KÍCH THƯỚC: | Yếu tố này xác định kích thước của X và Y kích thước của phim được sử dụng, và đơn vị là mét. |
ROLL_ID: | Yếu tố này xác định số cuộn hoặc ID của bộ phim. Đối với một số bộ phim, Hình này được mã hóa trên cuộn phim như một mã vạch. |
FRAME_ID: | Yếu tố này xác định số hướng ngược hoặc ID của hướng ngược số hóa từ cuộn phim. |
FILM_SPEED: | Yếu tố này xác định tốc độ phim của bộ phim. Yếu tố này được đo bằng ASA. |
N.6.2 Siêu dữ liệu mô tả nội dung
Siêu dữ liệu mô tả nội dung mô tả nội dung của thông tin đã chụp trong các ảnh. Đó là những thông tin ngữ nghĩa thường yêu cầu người dùng nhập vào. Giá trị của những thông tin đó tăng lên khi thời gian trôi qua. Yếu tố này có thể chứa các phần tử được liệt kê dưới đây.
Hình N.20 – Sơ đồ của siêu dữ liệu miêu tả nội dung
GROUP_CAPTION: | Yếu tố này xác định các chủ đề hoặc mục đích của ảnh. Nó có thể được sử dụng bổ sung để cung cấp bất kỳ loại thông tin khác liên quan đến ảnh. |
CAPTION: | Yếu tố này xác định các chủ đề hoặc mục đích của ảnh. Nó có thể được sử dụng bổ sung để cung cấp bất kỳ loại thông tin khác liên quan đến ảnh. |
CAPTURE TIME: | Yếu tố này xác định cụ thể ngày và giờ những ảnh ban đầu được tạo ra. Điều này có thể khác với ngày thiết bị chụp nơi các thiết bị chụp là một máy quét quét ảnh tại một thời điểm khác nhau để khi nó được chụp đầu tiên. Xem kiểu DateTime (N.7.1.8) cho định dạng của yếu tố này. |
LOCATION: | Yếu tố này mô tả vị trí của ảnh. Vị trí này là vị trí vật lý của ảnh (ví dụ, địa chỉ, tọa độ GPS), không phải là vị trí của một đối tượng trong ảnh. Xem loại Location (N.7.1.15) cho các định dạng của nguyên tố này. |
PERSON: | Mô tả người. Yếu tố này xác định một người trong một ảnh. Cú pháp của yếu tố này được quy định tại N.6.2.1. |
THING: | Mô tả vật. Yếu tố này xác định cụ thể tên các sự vật hữu hình được mô tả trong ảnh. Cú pháp của yếu tố này được quy định tại N.6.2.2. |
HOẶCGANIZATION: | Mô tả tổ chức. Yếu tố này xác định một tổ chức trong một ảnh. Cú pháp của yếu tố này được quy định tại N.6.2.3. |
EVENT: | Mô tả sự kiện. Yếu tố này xác định các sự kiện được mô tả trong ảnh. Cú pháp của yếu tố này được quy định tại N.6.2.4. |
AUDIO: | Yếu tố này xác định dòng âm thanh kết hợp với một ảnh. Cú pháp của yếu tố này được quy định tại N.6.2.7. |
PROPERTY: | Yếu tố này xác định thông tin được sử dụng đề mô tả một ảnh hoặc một đối tượng trong một ảnh. Cú pháp của yếu tố này được quy định tại N.6.2.8. |
DICTIONARY: | Yếu tố này xác định một từ điển của một tính chất. Cú pháp của yếu tố này được quy định tại N.6.2.9 |
COMMENT: | Yếu tố này xác định thông tin người sử dụng và/hoặc ứng dụng được định nghĩa vượt quá phạm vi của các đặc tính khác trong nhóm này. Xem yếu tố Comment (N.7.3.1) cho định dạng của yếu tố này. |
N.6.2.1 Siêu dữ liệu mô tả người
Yếu tố này xác định một người trong một ảnh. Xem loại Persion (N.7.1.13) cho định dạng của yếu tố này. Yếu tố này có thể chứa các phần tử được liệt kê dưới đây.
Hình N.21 – Sơ đồ của siêu dự liêu mô tả người
POSITION: | Yếu tố này xác định vị trí của người trong một ảnh. Xem loại Position (N.7.1.17) cho định dạng của yếu tố này. |
LOCATION: | Yếu tố này xác định vị trí vật lý của người. Yếu tố này không xác định vị trí tương đối của người. Xem loại Location (N.7.1.17) cho định dạng của yếu tố này. |
PROPERTY: | Yếu tố này xác định thông tin bổ sung mô tả người. Xem siêu dữ liệu đặc tính (N.6.2.8) cho định dạng của yếu tố này. |
N.6.2.2 Siêu dữ liệu mô tả đồ vật
Yếu tố này xác định các tên và/hoặc đặc tính của những thứ hữu hình được mô tả trong ảnh (ví dụ, Đài tường niệm Washington) hoặc các vùng trừu tượng. Yếu tố này có thể chứa các phần tử được liệt kê dưới đây.
Hình N.22 – Sơ đồ của siêu dữ liệu mô tả vật
NAME: | Yếu tố này xác định cụ thể tên của vật. |
COMMENT: | Yếu tố này xác định thông tin người sử dụng và/hoặc ứng dụng được định nghĩa vượt quá phạm vi của các đặc tính khác trong Thing. Xem yếu tố Comment (N.7.3.1) cho định dạng của yếu tố này. |
POSITION: | Yếu tố này xác định vị trí của vật trong ảnh. Xem loại Position (N.7.1.17) cho định dạng của yếu tố này. |
LOCATION: | Yếu tố này xác định vị trí vật lý của vật. Yếu tố này không xác định vị trí tương đối của vật trong ảnh. Xem loại Location (N.7.1.17) cho định dạng của yếu tố này. |
PROPERTY: | Vật cũng chứa nhiều đặc tính. Những đặc tính mô tả vật. Xem siêu dữ liệu đặc tính (N.6.2.8) cho định dạng của yếu tố này. |
THING: | Mô tả vật phụ. Các yếu tố Thing có thể chứa không hoặc nhiều yếu tố Thing, với việc giải thích rằng đây là những vật phụ của vật chứa. |
ID: | Yếu tố này là thuộc tính nhận diện cho vật. |
N.6.2.3 Siêu dữ liệu mô tả tổ chức
Yếu tố này xác định một tổ chức được mô tả trong một ảnh. Mô tả này cũng có thể được sử dụng để mô tả toàn bộ ảnh. Xem loại Hoặcganization (N.7.1.14) cho định dạng của yếu tố này. Yếu tố này có thể chứa các phần tử được liệt kê dưới đây.
Hình N.23 – Sơ đồ của siêu dữ liệu mô tả tổ chức
POSITION: | Yếu tố này xác định vị trí của tổ chức trong một ảnh. Xem loại Position (N.7.1.17) cho định dạng của yếu tố này. |
LOCATION: | Yếu tố này xác định vị trí vật lý của tổ chức. Yếu tố này không xác định vị trí tương đối của tổ chức. Xem loại Location (N.7.1.17) cho định dạng của yếu tố này. |
PROPERTY: | Yếu tố này xác định thông tin bổ sung mô tả tổ chức. Xem siêu dữ liệu đặc tính (N.6.2.8) cho định dạng của yếu tố này. |
N.6.2.4 Siêu dữ liệu mô tả sự kiện
Yếu tố này xác định việc mô tả các sự kiện được mô tả trong ảnh. Một sự kiện là nguyên nhân có vẻ đúng nhất tại sao một ảnh được chụp. Yếu tố này có thể chứa các phần tử được liệt kê dưới đây trừ khi có quy định khác.
Hình N.24 – Sơ đồ của siêu dữ liệu mô tả sự kiện
EVENT_TYPE: | Loại sự kiện. Nếu có một yếu tố sự kiện hoặc sự kiện phụ, yếu tố loại sự kiện phải tồn tại. Yếu tố loại sự kiện có thể xảy ra chỉ một lần trong một mức độ nút của một cây sự kiện hoặc một nhánh sự kiện phụ. |
DESCRIPTION: | Yếu tố này xác định việc mô tả về sự kiện này. Yếu tố này được sử dụng để mô tả một sự kiện trong định dạng văn bản con người có thể đọc được. |
LOCATION: | Yếu tố này xác định vị trí vật lý của sự kiện và không phải là vị trí trong ảnh. Xem loại Location (N.7.1.15) để biết thêm thông tin về yếu tố này. |
EVENT_TIME: | Ngày và thời gian sự kiện. Yếu tố xác định thời gian bắt đầu của sự kiện. Xem loại DateTime (N.7.1.8) cho các định dạng của yếu tố này. |
DURATION: | Yếu tố này xác định cụ thể khoảng thời gian diễn ra sự kiện. |
COMMENT: | Yếu tố này xác định thông tin người sử dụng và/hoặc ứng dụng được định nghĩa vượt quá phạm vi của các đặc tính khác trong Event. Xem yếu tố Comment (N.7.3.1) cho định dạng của yếu tố này. |
PARTICIPANT: | Yếu tố này chỉ những thành viên tham gia sự kiện này. Một thành viên tham gia có thể là một Persion, Hoặcganization hoặc Thing. Cú pháp của yếu tố này được quy định tại N.6.2.5. |
EVET_RELATION: | Mối quan hệ sự kiện. Yếu tố này xác định mối quan hệ với các sự kiện khác. Cú pháp của yếu tố này được quy định tại N.6.2.6.
Sự kiện phụ. Yếu tố sự kiện có thể chứa một hoặc nhiều yếu tố sự kiện phụ của sự kiện toàn diện. Một yếu tố sự kiện phụ có thể chứa các sự kiện phụ. Yếu tố sự kiện phụ có thể được chứa trong yếu tố sự kiện, hoặc được tham chiếu: |
EVENT: | Mô tả sự kiện phụ. |
EVENT_REF: | Tham chiếu sự kiện. Một tham chiếu tới sự kiện phụ. Yếu tố này là một liên kết đến một trong các yếu tố sự kiện khác. |
ID: | Yếu tố này xác định các định danh duy nhất cho sự kiện. |
N.6.2.5 Siêu dữ liệu người tham gia
Yếu tố này chỉ những thành viên tham gia sự kiện này. Một thành viên tham gia có thể là một Persion, Hoặcganization hoặc Thing.
Hình N.25 – Sơ đồ của siêu dữ liệu thành viên tham gia
ROLE: | Phần tử này xác định vai trò của thành viên tham gia trong sự kiện. |
OBJECT_REF: | Đối tượng tham chiếu. Phần tử này là một tham chiếu đến một thành viên tham gia. Phần tử này là một liên kết đến một trong những phần tử Persion, Hoặcganization hoặc Thing trong siêu dữ liệu mô tả nội dung. |
PERSION: | Phần tử này xác định một người là một thành viên tham gia một sự kiện nhưng không được mô tả trong ảnh. Xem siêu dữ liệu mô tả người (xem N.6.2.1) cho định dạng của phần tử này. |
THING: | Phần tử này xác định một vật là thành viên tham gia một sự kiện nhưng không được mô tả trong ảnh. Xem siêu dữ liệu mô tả đồ vật (xem N.6.2.2) cho định dạng của phần tử này. |
HOẶCGANIZATION: | Phần tử này xác định một tổ chức là thành viên tham gia một sự kiện nhưng không được mô tả trong ảnh. Xem siêu dữ liệu mô tả tổ chức (xem N.6.2.2) cho định dạng của phần tử này. |
N.6.2.6 Siêu dữ liệu mối quan hệ sự kiện
Phần tử này xác định mối quan hệ với các sự kiện khác. Chúng được sử dụng cho các mối quan hệ giữa các sự kiện mà không phải là sự kiện phụ trực tiếp của nhau. Một ví dụ về một mối quan hệ có thể là một liên kết đến một sự kiện trước đó của cùng loại.
Hình N.26 – Sơ đồ của siêu dữ liệu mối quan hệ sự kiện
RELATION: | Phần tử này xác định việc mô tả (các) mối quan hệ tới (các) sự kiện khác. |
EVENT_REF: | Tham chiếu sự kiện. Phần tử này là một tham chiếu đến các sự kiện liên quan. Phần tử này là một liên kết đến một trong các phần tử sự kiện khác trong siêu dữ liệu mô tả sự kiện. |
N.6.2.7 Siêu dữ liệu âm thanh
Phần tử này xác định siêu dữ liệu âm thanh kết hợp với một ảnh. Siêu dữ liệu ảnh có thể chứa không hoặc nhiều dòng âm thanh. Mỗi dòng âm thanh có thể chứa một phần tử bình luận mô tả âm thanh. Một bình luận duy nhất cũng sẽ có thể đề mô tả nhiều hơn một dòng âm thanh.
Hình N27 – Sơ đồ của siêu dữ liệu âm thanh
AUDIO_STREAM: | Phần tử này xác định một tham chiếu URI cho một dòng âm thanh. Định dạng của dòng không được xác định. |
AUDIO_FHOẶCMAT: | Định dạng dòng âm thanh. Phần tử này xác định tên của định dạng audio. Ví dụ, ANẾUF, MIDI, MP3 và WAV. |
MIMEJTPE: | Phần tử này xác định loại phương tiện truyền thông Internet của tập tin âm thanh. |
DESCRIPTION: | Phần tử này xác định mô tả về dòng âm thanh. |
COMMENT: | Phần tử này xác định thông tin người sử dụng và/hoặc ứng dụng được định nghĩa vượt quá phạm vi của các đặc tính khác trong âm thanh. Xem phần tử Comment (N.7.3.1) cho định dạng của phần tử này. |
N.6.2.8 Siêu dữ liệu thuộc tính
Phần tử này xác định một mô tả của một ảnh hoặc một đối tượng trong một ảnh. Phần tử này sẽ chứa một tên và có thể tùy chọn chứa một giá trị và các phần tử thuộc tính phụ. Một thuộc tính là một từ duy nhất hoặc một cụm từ nhỏ và một giá trị tùy chọn. Thuộc tính là một định nghĩa ngôn ngữ cụ thể không chính xác của ảnh hoặc một phần của ảnh. Phần tử này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.28 – Sơ đồ của siêu dữ liệu thuộc tính
NAME: | Phần tử này xác định tên của các thuộc tính. |
GIÁ TRỊ: | Phần tử này xác định giá trị thuộc tính. Một thuộc tính chứa một giá trị không thể chứa các thành phần thuộc tính phụ. |
COMMENT: | Phần tử này xác định thông tin người sử dụng và/hoặc ứng dụng được định nghĩa vượt quá phạm vi của các đặc tính khác trong thuộc tính. Xem phần tử Comment (N.7.3.1) cho định dạng của phần tử này. |
PROPERTY: | Thuộc tính phụ. Phần tử này xác định thuộc tính phụ của thuộc tính toàn diện. Một thuộc tính có chứa thuộc tính phụ không thể chứa một giá trị. |
DICREF: | Từ điển tham chiếu. Phần tử này xác định một tham chiếu cho một từ điển (xem N.6.2.9). |
N.6.2.9 Siêu dữ liệu định nghĩa từ điền
Phần tử này xác định tên của một từ điển. Một thuộc tính có thể được xác định bằng cách sử dụng một từ điển cụ thể. Ưu điểm của việc này là có một định nghĩa duy nhất cho mỗi siêu dữ liệu thuộc tính, và hai ghi chú siêu dữ liệu thuộc tính khác nhau không được sử dụng để xác định những điều tương tự.
Để đưa ra một ví dụ, một từ điển có thể định nghĩa chữ “Xe” sẽ được sử dụng để mô tả một chiếc xe, xe hơi, xe tải, ô tô, vv. Một ví dụ thứ hai là việc sử dụng từ “Ngày”. Ngày có thể được sử dụng để xác định “ngày” kết quả của lòng bàn tay và không phải là định nghĩa của ngày như một ngày. Phần tử này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.29 – Sơ đồ của siêu dữ liệu định nghĩa từ điển
DIC_NAME: | Tên từ điển. Phần tử này xác định tên của từ điển. |
COMMENT: | Phần tử này xác định thông tin người sử dụng và/hoặc ứng dụng được định nghĩa vượt quá phạm vi của các đặc tính khác trong từ điển. Xem phần từ Comment (N.7.3.1) cho định dạng của phần tử này. |
DIC_ID: | ID của từ điển, Phần tử này xác đ]nh định danh duy nhất của từ điển. |
N.6.3 Siêu dữ liệu lịch sử
Phần tử lịch sử có chứa một bản tóm tắt các hoạt động chỉnh sửa ảnh cơ bản mà đã được áp dụng cho ảnh và (các) phiên bản trước đó của siêu dữ liệu ảnh. Siêu dữ liệu lịch sử không được thiết kế để được sử dụng để đảo ngược (hoàn tác) các hoạt động chỉnh sửa ảnh. Phần từ này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.30 – Sơ đồ của siêu dữ liệu lịch sử
PROCESSING_SUMMARY: | Phần tử này xác định một danh sách các hoạt động trước đây áp dụng cho một ảnh trong quá trình làm việc của nó. Cú pháp của phần tử này được quy định tại N.6.3.1. |
IMAGE_PROCESSING_HINTS: | Phần tử này xác định một danh sách các hoạt động trước đây đã thực hiện khi chỉnh sửa ảnh. Cú pháp của phần tử này được quy định tại N.6.3.2. |
SIÊU DỮ LIỆU: | Siêu dữ liệu trước đây. Phần tử này xác định một phiên bản trước của siêu dữ liệu mà có thể bao gồm siêu dữ liệu về các phần của một ảnh đã bị xóa (ví dụ, đã bị cắt). Cú pháp của phần tử này được quy định tại N.6.3.3. |
N.6.3.1 Siêu dữ liệu tóm tắt xử lý
Phần tử này xác định một danh sách các hoạt động đã thực hiện trong suốt vòng đời của ảnh, liệt kê các hoạt động đã thực hiện và không phải là thứ tự hoặc số lần mỗi hoạt động được thực hiện.
Bản tóm tắt xử lý được định nghĩa dưới đây cần được xem xét tiềm năng và trong tất cả các thông tin một phần có thể đúng. Đó là bởi vì sự hiện diện của một gợi ý cụ thể, chẳng hạn như “Ảnh đã bị cắt”, chỉ ra rằng ảnh đã được cắt. Tuy nhiên, sự vắng mặt của một gợi ý “Ảnh đã bị cắt” là không đảm bảo rằng ảnh chưa bao giờ được cắt. Phần từ này có thể chứa các phần từ phụ được liệt kê dưới đây.
Hình N.31 – Sơ đồ của siêu dữ liệu tóm tắt xử lý
IMG_CREATED: | Loại sự kiện. Nếu có một phần tử sự kiện hoặc sự kiện phụ, phần tử loại sự kiện phải tồn tại. Phần tử loại sự kiện có thể xảy ra chỉ một lần trong một mức độ nút của một cây sự kiện hoặc một nhánh sự kiện phụ. |
IMG_CROPPED: | Phần tử này xác định việc mô tả về sự kiện này. Phần tử này được sử dụng để mô tả một sự kiện trong định dạng văn bản con người có thể đọc được. |
IMG_TRANSFHOẶCMED: | Phần tử này xác định vị trí vật lý của sự kiện và không phải là vị trí trong ảnh. Xem loại Location (N.7.1.15) để biết thêm thông tin về phần tử này. |
IMG_GTC_ADJ: | Ngày và thời gian sự kiện. Phần tử xác định thời gian bắt đầu của sự kiện. Xem loại DateTime (N.7.1.8) cho các định dạng của phần tử này. |
IMG STC_ADJ: | Phần tử này xác định cụ thể khoảng thời gian diễn ra sự kiện. |
IMG_SPATIAL_ADJ: | Phần tử này xác định thông tin người sử dụng và/hoặc ứng dụng được định nghĩa vượt quá phạm vi của các đặc tính khác trong Event. Xem phần tử Comment (N.7.3.1) cho định dạng của phần tử này. |
IMG_RETOUCHED: | Phần tử này chỉ những thành viên tham gia sự kiện này. Một thành viên tham gia có thể là một Persion, Hoặcganization hoặc Thing. Cú pháp của phần tử này được quy định tại N.6.2.5. |
IMG_EXT EDITTED: | Mối quan hệ sự kiện. Phần tử này xác định mối quan hệ với các sự kiện khác. Cú pháp của phần tử này được quy định tại N.6.2.6.
Sự kiện phụ. Phần tử sự kiện có thể chứa một hoặc nhiều phần tử sự kiện phụ của sự kiện toàn diện. Một phần tử sự kiện phụ có thể chứa các sự kiện phụ. Phần tử sự kiện phụ có thể được chứa trong phần tử sự kiện, hoặc được tham chiếu: |
IMG_COMPOSITED: | Mô tả sự kiện phụ. |
IMG_SIÊU DỮ LIỆU: | Tham chiếu sự kiện. Một tham chiếu tới sự kiện phụ. Phần từ này là một liên kết đến một trong các phần tử sự kiện khác. |
N.6.3.2 Siêu dữ liệu gợi ý xử lý ảnh
Phần tử này xác định một danh sách các hoạt động được thực hiện khi chỉnh sửa một ảnh. Chúng khác nhau từ tóm tắt xử lý trong đó các gợi ý liệt kê tất cả các hoạt động trong trật tự và các hoạt động có thể được liệt kê nhiều hơn một lần (nếu các hoạt động được sử dụng nhiều hơn một lần). Siêu dữ liệu tóm tắt xử lý liệt kê tất cả các hoạt động được thực hiện trong vòng đời của một ảnh trong khi siêu dữ liệu các gợi ý xử lý ảnh lưu trữ thiết lập mới nhất của các hoạt động chi tiết hơn. Danh sách đầy đủ các hoạt động (và thứ tự của chúng) có thể được tạo ra bằng cách kết hợp tất cả siêu dữ liệu gợi ý xử lý ảnh trong cây siêu dữ liệu lịch sử.
Phần tử các gợi ý xử lý ảnh có chứa các phần tử tương tự như siêu dữ liệu tóm tắt xử lý. Xem Tóm tắt xử lý (N.6.3.1) cho định nghĩa của từng phần tử. Mỗi phần tử phụ có thể xuất hiện nhiều hơn một lần trong mỗi trường và mỗi phần tử có thể chứa một mô tả bằng văn bản của hoạt động. Siêu dữ liệu các gợi ý xử lý ảnh được định nghĩa dưới đây cần được xem xét thông tin một phần có khả năng. Đó là bởi vì sự hiện diện của một gợi ý cụ thể, chẳng hạn như “Ảnh đã bị cắt,” chỉ ra rằng ảnh đã được cắt và siêu dữ liệu khác có thể được bỏ qua cùng một lúc. Tuy nhiên, sự vắng mặt của một gợi ý “Ảnh đã bị cắt” không đảm bảo rằng ảnh chưa bao giờ được cắt.
Hình N.32 – Sơ đồ của siêu dữ liệu các gợi ý xử lý ảnh
MODIFIER: | Phần tử này xác định ứng dụng (có lẽ hầu hết các phần mềm), thực hiện các hoạt động được liệt kê trong Tóm tắt xử lý (N.6.3.1). Xem loại chi tiết sản phẩm (N.7.1.21) cho các định dạng của phần tử này. |
N.6.3.3 Siêu dữ liệu trước
Phần tử này có chứa một phiên bản trước của siêu dữ liệu (bao gồm cả siêu dữ liệu lịch sử trước đó). Các định dạng của phần tử này được xác định cùng với siêu dữ liệu lịch sử (Hình N.30).
Mỗi lần một ảnh mới được tạo ra như một kết quả của việc chỉnh sửa ảnh hoặc kết hợp nhiều ảnh, một số siêu dữ liệu từ (các) ảnh trước đó có thể được chuyển đến hoặc tham chiếu bởi siêu dữ liệu lịch sử ảnh. Siêu dữ liệu tạo ảnh, mô tả nội dung, lịch sử và IPR (các) ảnh đóng góp có thể được ghi lại trong 332 phần tử siêu dữ liệu trước. Việc xem xét cẩn thận được thực hiện liên quan đến siêu dữ liệu này trước đó, đặc biệt là siêu dữ liệu IPR trước.
Hình N.33 – Sơ đồ của siêu dữ liệu trước
BASICJMAGE_PARAM: | Phần tử này xác định tham chiếu đến các phiên bản trước của ảnh. Cú pháp của phần tử này được quy định tại N.6.3.4. |
IMAGE_CREATION: | Phần tử này xác định thông tin tạo ra ảnh. Cú pháp của phần tử này được quy định tại N.6.1. |
CONTENT_DESCRIPTION: | Phần tử này xác định thông tin mô tả nội dung. Cú pháp của phần tử này được quy định tại N.6.2. |
HISTORY: | Phần tử này xác định siêu dữ liệu lịch sử trước đó. Cú pháp của phần tử này được quy định tại N.6.3. |
IPR: | Phần tử này xác định sở hữu trí tuệ ảnh. Cú pháp của phần tử này được quy định tại N.6.4. |
N.6.3.4 Siêu dữ liệu tham chiếu ảnh
Phần tử này xác định thông tin cho tham chiếu các phiên bản trước của ảnh. Phần tử này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.34 – Sơ đồ của siêu dữ liệu tham chiếu ảnh
FILE_NAME: | Trường này xác định tên của một tệp tin ảnh. |
FORMAT_TYPE: | Kiểu định dạng tệp tin. Trường này xác định định dạng tệp tin của ảnh. |
MIME TYPE: | Trường này xác định kiểu phương tiện truyền thông Internet của tệp tin ảnh. |
VERSION: | Trường này xác định phiên bản của định dạng tệp tin, |
IMAGE_ID: | Phần tử này xác định việc nhận dạng ảnh. Cú pháp cho phần tử này được quy định tại N.6.5. |
N.6.4 Siêu dữ liệu quyền sở hữu trí tuệ
Phần tử này xác định thông tin liên quan quyền sở hữu trí tuệ (IPR) gắn liền với ảnh chẳng hạn như quyền tinh thần, bản quyền cũng như việc khai thác thông tin.
Quyền tinh thần là những quyền được gắn với quá trình sáng tạo; do đó, quyền tinh thần luôn luôn gắn liền với tác giả hoặc người tạo ra tác phẩm nghệ thuật, trong khi đó bản quyền có thể được chuyển giao nhiều lần tới các chủ sở hữu khác nhau, dưới các điều kiện khai thác mà còn là một phần của IPR và siêu dữ liệu khai thác. Thông tin bổ sung như điều kiện sử dụng, tên, mô tả nội dung, ngày tháng, cũng như công việc hành chính liên quan đến sở hữu trí tuệ, sự nhận dạng (ví dụ, một số hàng tồn kho duy nhất) và điểm liên lạc để khai thác cũng được coi là siêu dữ liệu quan trọng.
Sử dụng và giải thích các thông tin này là vượt quá phạm vi của Tiêu chuẩn này. Không có gì trong Tiêu chuẩn này được dùng để ám chỉ hoặc từ bỏ nghĩa vụ hợp lệ hoặc giới hạn có thể áp dụng trong bất kỳ quyền hạn cụ thể nào.
CHÚ THÍCH: – Người thực hiện nên đưa vào tài khoản Tổ chức Sở hữu trí tuệ thế giới (WIPO) các tài liệu được liệt kê trong tài liệu tham khảo và các ấn phẩm WIPO khác, nếu thích hợp.
Phần tử này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.35 – Sơ đồ của siêu dữ liệu quyền sở hữu trí tuệ
IPR_NAMES: | Phần tử này xác định tên liên quan đến ảnh đại diện. Cú pháp của phần tử này được quy định tại N.6.4.1. |
IPR_DESCRIPTION: | Phần tử này xác định mô tả của nội dung như tiêu đề và ghi chú. Cú pháp của phần tử này được quy định tại N.6.4.2. |
IPR_DATES: | Phần tử này xác định thông tin ngày liên quan đến IPR. Cú pháp của phần tử này được quy định tại N.6.4.3. |
IPR_EXPLOITATION: | Phần tử này xác định việc khai thác thông tin như loại bảo vệ, hạn chế sử dụng và giao ước để khai thác một ảnh. Cú pháp của phần tử này được quy định tại N.6.4.4. |
IPR_NHẬN BIẾT: | Phần tử này xác định một định danh của một ảnh đó là một liên kết đến một nơi mà thông tin bổ sung được giữ. Cú pháp của phần tử này được quy định tại N.6.4.6. |
IPR_CONTACT_POINT: | Phần tử này xác định các điểm liên hệ của người nắm quyền. Cú pháp của phần tử này được quy định tại N.6.4.9. |
IPR_HISTORY: | Phần tử này có chứa siêu dữ liệu sở hữu trí tuệ trước. Nội dung được quy định tại N.6.4.10. |
N.6.4.1 Siêu dữ liệu tên quyền sở hữu trí tuệ
Phần tử này xác định các tên gọi liên quan đến ảnh đại diện. Những tên này bao gồm các loại khác nhau, chẳng hạn như tác giả, nhiếp ảnh gia, nhà sản xuất, tất cả những ai đòi hỏi quyền lợi. Người xuất hiện trong ảnh cũng được đặt tên, như có những hạn chế về công bố ảnh của một người không đồng ý công bố thay đổi từ nước này sang nước. ”Ai”, “cái gì” và “ở đâu” (tức là, chủ đề của ảnh) cũng có thể là những cái tên trong tiêu đề của ảnh.
Một tên có thể là một người, một tổ chức, hoặc một tham chiếu đến một tên hoặc một người. Xem loại Person (N.7.1.13) và loại Hoặcganization (N.7.1.14), tương ứng với định dạng của phần tử này. Phần tử này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.36 – Sơ đồ của siêu dữ liệu các tên gọi quyền sở hữu trí tuệ
IPR_PERSION: | Người. Phần tử này xác định việc mô tả người. Xem loại Person (N.7.1.13) cho định dạng của phần tử này. |
IPR_ORG: | Tổ chức. Phần tử này xác định việc mô tả tổ chức. Xem loại Hoặcganization (N.7.1.14) cho định dạng của phần tử này. |
IPR_NAME_REF: | Tên tham khảo. Phần tử này xác định một tham chiếu đến một người hoặc tổ chức trong siêu dữ liệu quyền sở hữu trí tuệ. |
DESCRIPTION: | Phần tử này là mô tả của tên. Bảng N.14 liệt kê các giá trị đề nghị cho phần tử này có ý nghĩa sau đây. |
Bảng N.14 – Các giá trị mô tả tên
Giá trị |
Ý nghĩa |
Tác giả làm việc ban đầu | Giá trị này xác định rằng phần tử này là tên của tác giả người đã tạo ra tác phẩm gốc được đại diện trong ảnh (ví dụ, họa sĩ điêu khắc, kiến trúc sư, vv), khi ảnh không phải là một sáng tạo riêng của mình. Ngược lại, một bức ảnh của một hoàng hôn sẽ được coi là một sáng tạo của các nhiếp ảnh gia. Một tác giả tác phẩm gốc có thể là “vô danh”. |
Người tạo ra ảnh | Giá trị này xác định rằng phần tử này là tên của người tạo ra ảnh.
Người tạo ảnh có thể là, ví dụ, các nhiếp ảnh gia đã chụp được ảnh ban đầu trên phim, người vẽ tranh minh họa hoặc nghệ sĩ đồ họa thực hiện quá trình tạo ảnh, vv |
Người nắm quyền | Giá trị này xác định rằng phần tử này là tên của người nắm quyền sở hữu trí tuệ của ảnh.
Người nắm quyền có thể là tác giả của ảnh, một cơ quan ảnh cổ phần, hoặc nhà cung cấp. Đó là người bán giấy phép cho bất cứ ai bằng lòng để khai thác ảnh, chẳng hạn như một nhà xuất bản cũng sẽ bán các kết quả hoặc một người tiêu dùng trong một quá trình trả cho mỗi lượt xem. Người nắm quyền đã giành được bản quyền từ tác giả hoặc chủ sở hữu trước đó ngay trong một giao dịch mà thường đã được đăng ký chính thức. |
Các cá nhân đại diện | Giá trị này xác định rằng phần tử này là tên của một cá nhân hiển thị trong hình.
Điều này có thể được sử dụng như một mô tả của ảnh hoặc vì quyền riêng tư có thể yêu cầu cá nhân mô tả sự đồng ý nhượng lại để xuất bản ảnh của họ. Trong một ví dụ như vậy, phần tử mô tả này có thể dẫn đến hạn chế sử dụng cho các ảnh, cũng như mô tả các nội dung ảnh. |
N.6.4.2 Siêu dữ liệu mô tả quyền sở hữu trí tuệ
Phần tử này xác định mô tả của nội dung. Nó có thể là mong muốn có một lời giải thích bổ sung về nội dung của ảnh để khai thác nội dung. Ví dụ, một mô tả kỹ thuật của nội dung có thể giúp người sử dụng hiểu biết và, do đó, đánh giá nội dung của một ảnh (ví dụ, trường hợp mà ảnh đã được chụp). Định dạng là nhà cung cấp quy định. Phần tử này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.37 – Sơ đồ của siêu dữ liệu mô tả quyền sở hữu trí tuệ
IPR_TITLE: | Tiêu đề của ảnh. Phần tử này xác định tiêu đề của ảnh. Nó là một chuỗi có thể được sử dụng, ví dụ, như một ghi chú khi in. Khi tác giả tạo ra tiêu đề, người ta có thể thêm ý nghĩa cho ảnh. Tuy nhiên, các tiêu đề không nhất thiết quan trọng trong quyền sở hữu trí tuệ. Điều này được xác định trên cơ sở từng trường hợp cụ thể. |
IPR_LEGEND: | Lời ghi chú. Phần từ này xác định lời ghi chú, một ghi chú thêm vào ảnh, ví dụ, ở mặt sau của một bức ảnh, được viết bởi các nhiếp ảnh gia đề sau đó phân loại các bức ảnh. Nó thường là một mô tả chi tiết hoặc kỹ thuật của những gì xuất hiện trong ảnh. Phần tử này có thể trả lời câu hỏi “Tại sao?” Một ví dụ được nói, “ảnh chụp vào lúc bình minh để thử nghiệm một 135 mm. Phóng to trên chân đế.” |
IPR_CAPTION: | Ghi chú. Phần tử này xác định ghi chú của ảnh. Phần tử này đề cập đến các văn bản đã được thêm vào như là thông tin bổ sung để hỗ trợ trong việc tìm hiểu nội dung của ảnh (ví dụ, bản dự thảo thứ hai của Durer cho một nghiên cứu về một cảnh Kinh Thánh). Ghi chú thường có một động lực hướng dẫn. |
COPYRIGHT: | Bản quyền. Phần tử này xác định thông báo bản quyền của ảnh. Thông thường phần tử này xác định người nắm quyền muốn được nhận biết, nói ví dụ, “bản quyền cơ quan XYZ.”. Đây là một dấu hiệu cho thấy thuộc tính của ảnh được xác định rõ và điểm liên hệ là cơ quan được chỉ định. |
N.6.4.3 Siêu dữ liệu thời hạn quyền sở hữu trí tuệ
N.6.4.3 IPR Dates siêu dữ liệu
Phần tử này xác định thông tin thời hạn liên quan đến quyền sở hữu trí tuệ. Có rất nhiều các dịnh dạng DateTime hợp thức. Ví dụ, một thời hạn có thể là đúng một năm, có thể với tháng và ngày, đôi khi với giờ, phút, giây và một phần nghìn (ví dụ, dấu thời gian ISO luôn luôn là giờ GMT). Tuy nhiên, thời hạn cũng có thể ít bị giới hạn. Ví dụ, thời hạn có thể là “nửa đầu của thế kỉ 15″, “cuối tuổi trung niên”, “La Mã cổ”, vv.
Các ứng dụng chuyên nghiệp có thể chọn một thời hạn chính xác, trong khi chỉ định một năm ± 5 năm có thể thỏa mãn người dùng của các bức ảnh đầu thế kỷ.
Phần tử này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.38 – Sơ đồ của siêu dữ liệu thời hạn IPR
IPR_DATE: | Phần tử ngày có chứa một ngày chính xác tùy ý. Xem kiểu DateTime (N.7.1.8) cho định dạng của phần tử này. Phần tử bình luận được xác định trong loại DataTime có thể được sử dụng để mô tả thêm thông tin về các phần tử. |
DESCRIPTION: | Phần tử này là mô tả của thời hạn. Độ chính xác của thời hạn sở hữu trí tuệ có thể thay đổi về độ chính xác tùy thuộc vào độ tuổi của các hoạt động hoặc mục và các thông tin khác được biết đến tại thời điểm của thế hệ siêu dữ liệu. Bảng N.15 liệt kê các giá trị đề nghị cho phần tử có ý nghĩa sau đây. |
Bảng N.15 – Các giá trị mô tả thời hạn
Giá trị |
Ý nghĩa |
Sự tạo tác phẩm ban đầu | Giá trị này xác định rằng phần tử này là ngày mà tác phẩm gốc đã được tạo ra. Tất cả các loại thời hạn có thể xuất hiện ở đây, như đã nói ở trên. |
Ảnh được chụp | Giá trị này xác định rằng phần tử này là ngày mà các bức ảnh được chụp. Một số máy ảnh kỹ thuật số chèn thông tin này một cách tự động. |
Đã quét | Giá trị này xác định rằng phần tử này là ngày mà ảnh đã được quét. |
Đã xử lý | Giá trị này xác định rằng phần tử này là ngày mà ảnh đã được xử lý. |
Đã chỉnh sửa | Giá trị này xác định rằng phần tử này là ngày khi bất kỳ loại sửa đổi đã được thực hiện với tác phẩm gốc. Phần tử này sẽ lưu trữ các ngày sửa đổi gần đây nhất. Mặc dù nó là hợp lệ để có nhiều hơn một ngày chỉnh sửa trong phần này, nó sẽ được phổ biến hơn là toàn bộ quyền sở hữu trí tuệ được cập nhật trong thời gian sửa đổi, và những sửa đổi trước đó chuyển đến lịch sử sở hữu trí tuệ. Công cụ xử lý có thể tạo ra ngày này một cách tự động. |
Chỉnh sửa lần cuối | Giá trị này xác định ngày cuối cùng ảnh đã được sửa đổi. Ngày này nên được dễ dàng tìm thấy, bởi vì có thể có hoặc là một quá trình tự động đặt phần tử này và thay thế trước “sửa đổi cuối cùng” như là một “phần tử lịch sử” hoặc một quá trình thủ công, là các nhà điều hành đã làm các hoạt động tương tự bằng tay. |
N.6.4.4 Siêu dữ liệu khai thác quyền sở hữu trí tuệ
Phần tử này xác định siêu dữ liệu để nhận dạng các cơ chế bảo vệ sở hữu trí tuệ, những hạn chế cụ thể áp đặt bởi chủ sở hữu hoặc các nghĩa vụ phát sinh từ việc sử dụng các ảnh, và hệ thống quản lý quyền sở hữu trí tuệ được sử dụng cho siêu dữ liệu quyền sở hữu trí tuệ này. Phần tử này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.39 – Sơ đồ của siêu dữ liệu khai thác quyền sở hữu trí tuệ
IPR_PROTECTION: | Phần tử này có thể chỉ ra rằng có một thủy vân, rằng ảnh đã được đăng ký, hoặc ảnh được bảo vệ bởi một số phương tiện khác. Một giá trị 0 xác định rằng các ảnh không được bảo vệ và không chứa thủy vân. Các giá trị từ 1 đến 255 được dành riêng cho Cơ quan đăng kí tiện ích JPEG (JURA) sử dụng. Các giá trị khác có thể tồn tại. Nếu phần tử này không có mặt, sau đó nội dung thủy vân (hoặc sự hiện diện của nó) là không xác định. |
IPR_USE_RESTRICTION: | Phần tử này xác định các hạn chế sử dụng một ảnh. Có thể áp dụng các hạn chế sử dụng một ảnh mà không được cho phép bên ngoài nhà máy cho các ứng dụng công nghiệp, hoặc có các đặc quyền sao chép đã được giao cho một cơ quan duy nhất, hoặc có sự cho phép trước của người đại diện là bắt buộc trước khi xuất bản. Các hạn chế khác có thể tồn tại. |
IPR_OBLIGATION: | Phần tử này xác định các nghĩa vụ khai thác một ảnh. Nghĩa vụ có thể liên quan đến bất kỳ điều kiện bắt buộc đối với khai thác nội dung của một tập tin. Ví dụ, các thông tin bản quyền có thể được yêu cầu để được viết ở mặt bên của bất kỳ bản in nào cho các ảnh; các nghĩa vụ khác có thể liên quan đến sự cần thiết để có được sự cho phép từ những người đại diện trên ảnh nếu ảnh được công bố. Các nghĩa vụ có thể thay đổi theo thời gian. Ví dụ, nó có thể bị cấm công khai một bức ảnh trước ngày cho phép, vv |
IPR_MGMT_SYS: | Hệ thống quản lý quyền sở hữu trí tuệ. Phần tử này xác định những gì hệ thống quản lý được sử dụng. Cú pháp của phần tử này được quy định tại N.6.4.5. |
N.6.4.5 Siêu dữ liệu hệ thống quản lý IPR
Các hệ thống quản lý quyền sở hữu trí tuệ như IPMP (Bảo vệ và quản lý sở hữu trí tuệ) hoặc ECMS (Hệ thống quản lý bản quyền điện tử) sử dụng các phần tử này để xác định nơi thông tin được lưu giữ liên quan đến hệ thống quản lý. Một ví dụ sử dụng các phần tử này là để theo dõi việc sử dụng một ảnh. Trong khi chuyển nhượng, một cơ quan xác định chủ sở hữu của các ảnh từ các phần tử các hệ thống quản lý. Nó đã biết người tiêu dùng, và sử dụng thông tin này để tính phí người dùng và uy tín của chủ sở hữu số tiền được xác định bởi hệ thống quản lý. Thông tin này thường được lưu trữ trên một máy chủ mô tả quyền sở hữu trí tuệ của ảnh, và tùy thuộc vào việc cấp giấy phép sở hữu trí tuệ là bắt buộc hoặc khuyến khích, phải có một liên kết đến nơi mà tất cả thông tin về nó được giữ. Phần tử này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.40 – Sơ đồ của siêu dữ liệu các hệ thống quản lý IPR
IPR_MGMT_TYPE: | Loại hệ thống quản lý IPR được sử dụng |
IPR_MGMT_ID: | Thông tin của một ID. |
IPR_MGMT_LOCATION: | Thông tin của vị trí. Ví dụ, URL. |
N.6.4.6 Siêu dữ liệu nhận dạng IPR
Phần tử này đặc tả liên kết với một vị trí (ví dụ, cơ sở dữ liệu bảo mật hoặc vị trí lưu trữ khác), nơi giữ lại thông tin tới hạn. Bộ định danh sẽ nhận dạng nội dung, vì vậy, nếu một ảnh được thu, sửa đổi hoặc tạo thành một ảnh mới, thì ảnh sẽ được ghi nhận lại và bộ nhận dạng mới sẽ nhận được, vì giờ đây sẽ có hai đối tượng thay vì chỉ đơn thuần một. Tuy nhiên, ảnh cha sẽ xuất hiện trong bộ siêu dữ liệu của ảnh con. Phần tử này có thể chứa phần tử con được liệt kê dưới đây.
Hình N.41 – Sơ đồ siêu dữ liệu nhận dạng quyền sở hữu trí tuệ
IPR_IDENTIFIER: | Nhận dạng IPR chung. Phần tử này chứa một bộ nhận dạng IPR mục đích chung. Cú pháp của phần từ này được đặc tả trong N.6.4.7. |
LICENCE_PLATE: | Phần tử này đặc tả bản quyền nội dung. Cú pháp của phần tử này được đặc tả trong N.6.4.8. |
N.6.4.7 Siêu dữ liệu nhận dạng IPR chung
Phần tử này xác định một bộ nhận dạng IPR chung. Phần tử này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.42 – Sơ đồ của siêu dữ liệu bộ nhận dạng IPR chung
IPR_ID_MODE: | Phần tử này xác định các chế độ nhận dạng. |
IPR ID: | Phần tử này xác định việc nhận dạng. Phần tử Mode mô tả nội dung của phần tử này. |
N.6.4.8 Siêu dữ liệu giấy phép
Phần tử này xác định các giấy phép của ảnh ban đầu, được định nghĩa trong ISO/IEC 10918-3. Sự kết hợp của các phần tử trong giấy phép chứa một chuỗi các con số xác định duy nhất toàn cầu. Phần tử này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.43 – Sơ đồ của siêu dữ liệu giấy phép
LP_COUNTRY: | Phần tử này xác định quốc gia đăng ký. Các phần tử có chứa mã quốc gia (3 chữ số) cho Giấy phép như được định nghĩa trong ISO 3166-1. |
LP_REG_AUT: | Phần tử này xác định số cơ quan đăng ký cho giấy phép. |
LP_REG_NUM: | Phần tử này xác định số đăng ký Giấy phép. |
LP_DELIVERY_DATE: | Phần tử này xác định khi Giấy phép được giao cho người đăng ký bởi Cơ quan Đăng ký. |
N.6.4.9 Siêu dữ liệu điểm liên hệ IPR
Phần tử này xác định điểm liên hệ của người nắm quyền. Nó bao gồm một cách để liên hệ với người nắm quyền hiện tại để có được các quyền dưới hình thức của một giấy phép. Những thông tin này có thể là một địa chỉ bưu điện, địa chỉ URL hoặc bất kỳ số điện thoại hoặc số fax nào là một liên kết không rõ ràng cho người nắm quyền.
Một điểm liên hệ có thể là một người, một tổ chức, hoặc một tham chiếu đến một tên hoặc một người. Phần tử này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.44 – Sơ đồ của siêu dữ liệu điểm liên hệ IPR
IPR_PERSON: | Phần tử này xác định mô tả người. Cú pháp của phần tử này được quy định tại N.6.4.1. |
IPR_ORG: | Tổ chức. Phần tử này xác định mô tả tổ chức. Cú pháp của phần tử này được quy định trong tên sở hữu trí tuệ (xem N.6.4.1). |
IPR_NAME_REF: | Tên tham khảo. Phần tử này xác định một tham chiếu đến một người hoặc tổ chức trong siêu dữ liệu IPR. Phần tử này là một liên kết đến một trong những phần tử Person hoặc Hoặcganization trong siêu dữ liệu tên sở hữu trí tuệ (xem N.6.4.1). |
DESCRIPTION: | Phần tử này là mô tả của điểm liên hệ đó là một giá trị bổ sung cho người hoặc tổ chức trong Bảng N.14. Các giá trị được liệt kê trong Bảng N.16 được thêm vào và có ý nghĩa sau đây. |
Bảng N.16 – Các giá trị mô tả tên bổ sung
Giá trị |
Ý nghĩa |
Bộ sưu tập | Giá trị này là một liên kết đến một nhà sưu tập, bảo tàng, nhóm, cơ quan, vv.
Các điểm liên hệ có thể là một liên kết đến một tên quy định tại các tên gọi IPR. |
N.6.4.10 Siêu dữ liệu lịch sử IPR
Phần tử này xác định siêu dữ liệu sở hữu trí tuệ trước. Định dạng của phần tử này được xác định cùng với các siêu dữ liệu quyền sở hữu trí tuệ (Hình N.35).
Mỗi lần thông tin sở hữu trí tuệ của một ảnh được thay đổi, một số siêu dữ liệu sở hữu trí tuệ được xác định thông qua N.6.4.1 và N.6.4.9 có thể được chuyển đến phần tử siêu dữ liệu lịch sử sở hữu trí tuệ này. Siêu dữ liệu lịch sử IPR lưu trữ tất cả các sửa đổi liên quan siêu dữ liệu IPR.
N.6.5 Siêu dữ liêu nhận dạng ảnh
Phần tử này chỉ là một ảnh nhận dạng xác định duy nhất ảnh. Các định dạng có thể toàn cầu duy nhất (ví dụ, UUID), nhà cung cấp hoặc ứng dụng phụ thuộc. Phần tử này có thể chứa các phần tử được liệt kê dưới đây.
Hình N.45 – Sơ đồ của siêu dữ liệu bộ nhận dạng ảnh
UID: | Nhận dạng duy nhất. Phần tử này xác định bộ nhận dạng duy nhất của một ảnh. Các phần tử ID_TYPE xác định định dạng của trường này. |
ID_TYPE: | Loại bộ nhận dạng duy nhất. Phần tử này xác định kiểu của phần tử UID như một URI. |
N.7 Dạng cơ bản và định nghĩa phần tử
Sơ đồ XML phần 2 xác định nhiều kiểu dữ liệu có nguồn gốc và gắn liền, tuy nhiên, chúng không đủ để xác định các phần tử siêu dữ liệu khác nhau được định nghĩa trong Tiêu chuẩn này. Mục này xác định những loại phổ biến và các phần tử được tham chiếu trong các hộp siêu dữ liệu khác. Các loại và các phần tử được xác định chỉ nhằm mục đích được sử dụng hoặc được đề cập trong các sơ đồ khác, và không có ý nghĩa nội tại.
N.7.1 Các dạng định nghĩa
N.7.1.1 Loại số thực hai byte không âm
Kiểu này được dùng cho các số đôi lớn hơn hoặc bằng 0.
Hình N.46 – Sơ đồ của dạng kép không âm
N.7.1.2 Dạng hữu tỉ
Kiểu này được sử dụng để xác định số hữu tỉ. Nó chứa một bộ đếm và mẫu số trong một chuỗi đơn.
Hình N.47 – Sơ đồ của kiểu hữu tỉ
N.7.1.3 Chuỗi bao gồm dạng thuộc tính ngôn ngữ
Kiểu này được sử dụng để khi một phần tử đòi hỏi một chuỗi và một định nghĩa thuộc tính ngôn ngữ. Các nội dung của phần tử này được thiết kế để lưu trữ dữ liệu con người có thể đọc được.
Hình N.48 – Sơ đồ của kiểu thuộc tính chuỗi bao gồm ngôn ngữ
N.7.1.4 Dạng độ
Kiểu này xác định một hướng theo độ và các phân số của độ. Ý nghĩa chính xác của các giá trị phụ thuộc vào cách sử dụng.
Hình N.49 – Sơ đồ của kiểu độ
N.7.1.5 Dạng nửa độ
Kiểu này xác định một hướng theo độ và các phân số của độ. Ý nghĩa chính xác của các giá trị phụ thuộc vào cách sử dụng. Kiểu này xác định một phạm vi nhỏ hơn kiểu độ (xem N.7.1.4).
Hình N.50 – Sơ đồ của kiểu nửa độ
N.7.1.6 Dạng kích cỡ gấp đôi
Kiểu này xác định một kích thước trong tọa độ số thực.
Hình N.51 – Sơ đồ của kiểu kích thước số thực
N.7.1.7 Dạng kích cỡ nguyên
Kiểu này xác định một kích thước trong tọa độ số nguyên (ví dụ, các điểm ảnh).
Hình N.52 – Sơ đồ của kiểu kích thước số nguyên
N.7.1.8 Dạng ngày tháng
Kiểu này xác định một phần hoặc ngày chính xác. Một ngày có thể bao gồm một ngày cụ thể (ví dụ, ngày 26 tháng một năm 2000), hoặc một định nghĩa rộng hơn như “Mùa đông”. Một ngày có thể hoặc không bao gồm một thời gian. Kiểu này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.53 – Sơ đồ của kiểu DateTime
EXACT: | Phần tử này chứa ngày và thời gian chính xác. |
DATE: | Phần tử này chứa một ngày (không kể thời gian trong ngày) |
MONTH: | Phần tử này chứa một tháng trong năm. Một giá trị số nguyên được sử dụng chứ không phải là một chuỗi để phù hợp với các phần tử khác được chứa trong các loại DateTime. Giá trị cho tháng một tương ứng với 1 và tháng mười hai ứng với 12. |
YEAR: | Phần tử này chứa một năm dương lịch. Giá trị dương được sử dụng cho sau Công nguyên và âm đối với trước Công nguyên. Năm 0 là không hợp lệ. |
CENTURY: | Phần tử này chứa thế kỷ mà một sự kiện xảy ra. Ví dụ, thế kỷ XX được lưu trữ “19.” Thế kỷ 0 là không hợp lệ. |
WEEK_DAY: | Phần tử này là một mô tả văn bản của ngày. Ví dụ như, “Thứ hai” và “Thứ sáu”. |
SEASON: | Phần tử này là một mô tả văn bản của một mùa. Ví dụ như, “Mùa xuân”, “Mùa hè”, “Mùa thu” và “Mùa đông.” |
COMMENT: | Xem phần tử Comment (N.7.3.1) đề biết thêm thông tin về phần tử này. Ví dụ như “Chúa Nhật Phục Sinh”, “Buổi sáng”, “Chỉ sau khi ăn trưa”. |
N.7.1.9 Dạng địa chỉ
Kiểu này xác định địa chỉ của một đối tượng hoặc vị trí. Ví dụ, nó có thể được sử dụng để mô tả các địa chỉ ảnh được chụp, hoặc địa chỉ của chủ sở hữu trí tuệ của một ảnh. Kiểu này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.54 – Sơ đồ của kiểu địa chỉ
ADDR_NAME: | Tên địa chỉ. Nó là một phần tử mô tả cho địa chỉ. |
ADDR_COMP: | Địa chỉ thành phần. Nhiều phần tử được sử dụng để xác định địa chỉ đầy đủ. Thứ tự của các phần tử địa chỉ xác định địa chỉ đầy đủ. Một địa chỉ đầy đủ sẽ được tạo ra bằng cách kết hợp các phần tử địa chỉ riêng biệt. Ví dụ, nếu kiểu là một “nhà nước”, yếu tố này có chứa tên của nhà nước. Nơi mà kiểu là một “đường phố”, phần tử này có chứa tên của đường phố. ISO 3166-2 liệt kê mã số khu vực quốc gia. Các mã này có thể được sử dụng trong phần tử này, khi phần tử được sử dụng để xác định một khu vực quốc gia. |
TYPE: | Đây là tên của một phần của địa chỉ. Ví dụ như “đường phố” hay “nhà nước”. ISO 3166-2 xác định các khu vực quốc gia và các kiểu của các khu vực này. Những kiểu khu vực có thể được sử dụng để xác định kiểu địa chỉ. Các giá trị đề nghị và ý nghĩa tương ứng của chúng được liệt kê trong Bảng N.17. Nhiều giá trị sẽ không được quy định trong một phần tử duy nhất. |
Bảng N.17 – Các giá trị kiểu thành phần địa chỉ
Giá trị |
Ý nghĩa |
Đơn vị | Số đơn vị của địa chỉ để nhận diện một ngôi nhà hoặc một tên nhà liên quan đến một đường phố. |
Phòng | Số phòng trong một tòa nhà hoặc một căn hộ. |
Phố | Địa chỉ đường phố trong một địa chỉ bưu điện. Ví dụ như tên đường phố, đại lượng và số nhà. |
Hộp thư | Số hộp thư bưu điện. |
Thành phố | Địa phương của một khu vực địa lý. |
Quốc gia | Tên của một khu vực địa lý. Các thuật ngữ khác như “Tỉnh”, “Quận”, “Hạt” có thể được sử dụng thay thế. |
ZIPCODE/POSTCODE: | Phần tử này xác định các mã bưu chính (hoặc zip code) của địa chỉ. Phần tử này không giới hạn độ dài. Các phần tử có tên là “Mã bưu chính” hoặc “Zip code”. Một địa chỉ không thể chứa cả mã bưu chính và zip code. |
COUNTRY: | Phần tử này xác định quốc gia của địa chỉ. Các phần từ có thể chứa mã quốc gia theo quy định tại ISO 3166-1 hoặc một chuỗi xác định đất nước. Mã quốc gia ISO 3166-1 được lựa chọn. |
TYPE: | Phần tử này xác định kiểu của toàn bộ địa chỉ. Kiểu địa chỉ sẽ bao gồm xem địa chỉ đó là một địa chỉ nhà hoặc một địa chỉ kinh doanh. Các giá trị kiểu đươc đề nghị được liệt kê trong Bảng N.18. Nhiều giá trị kiểu có thể được xác định giới hạn bằng một dấu phẩy (“,”). |
Bảng N.18 – Các giá trị kiểu địa chỉ
Giá trị |
Ý nghĩa |
Trong nước | Địa chỉ phân phối trong nước. |
Quốc tế | Địa chỉ phân phối quốc tế. |
Bưu chính | Địa chỉ phân phối bưu chính. |
Nhà | Địa chỉ phân phối cho một nơi cư trú. |
Công việc | Địa phương của một nơi làm việc. |
N.7.1.10 Dạng số điện thoại
Kiểu này xác định một số điện thoại. Kiểu này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.55 – Sơ đồ của kiểu số điện thoại
COUNTRY_CODE: Phần tử này chửa phần mã quốc gia của một số điện thoại. Mã điện thoại này không bao gồm bất kỳ tiền tố như “00” được sử dụng để quay các số quốc tế, mà thay vào đó chỉ là mã quốc gia quốc tế. Phần tử này cũng không bao gồm một dấu “+” đứng đầu.
AREA: Phần tử này chứa phần mã vùng địa phương của một số điện thoại. Mã vùng này không bao gồm số 0 đứng đầu (hoặc chữ số khác) được sử dụng để quay một số tiểu bang từ bên trong một quốc gia. Có vẻ như nó sẽ được nối trực tiếp đến một mã quốc gia.
LOCAL: | Phần tử này chứa số điện thoại địa phương. |
EXTENSION: | Phần tử này chứa phần mở rộng của các số điện thoại. |
TYPE: | Phần tử này xác định kiểu của số điện thoại. Kiểu số điện thoại sẽ bao gồm xem số điện thoại đó là một số điện thoại nhà hoặc số điện thoại kinh doanh kinh doanh. Các giá trị kiểu được đề nghị được liệt kê trong Bảng N.19. Nhiều giá trị kiểu có thể được xác định giới hạn bằng một dấu phẩy(“,”). |
Bảng N.19 – Các giá trị kiểu số điện thoại
Giá trị |
Ý nghĩa |
Nhà | Số điện thoại liên kết với một nơi cư trú. |
Tin nhắn | Số điện thoại có hỗ trợ tin nhắn thoại. |
Công việc | Số điện thoại liên kết với một nơi làm việc. |
Thoại | Số điện thoại cho thấy một điện thoại bằng giọng nói. |
Tế bào | Số điện thoại di động. |
Video | Số điện thoại hội nghị video. |
BBS | Số điện thoại hệ thống bảng thông báo. |
Modem | Một modem được kết nối số điện thoại. |
Ô tô | Một số điện thoại của điện thoại trong ô tô. |
ISDN | Số điện thoại dịch vụ ISDN. |
PCS | Số điện thoại dịch vụ truyền thông cá nhân. |
N.7.1.11 Dạng địa chỉ thư điện tử
Kiểu này xác định một địa chỉ email. Kiểu này có thể chứa các phần tử phụ đưực liệt kê dưới đây.
Hình N.56 – Sơ đồ của kiểu địa chỉ email
TYPE: | Phần tử này chứa kiểu địa chỉ email. |
N.7.1.12 Dạng địa chỉ web
Kiểu này xác định một địa chỉ web. Kiểu này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.57 – Sơ đồ của kiểu địa chỉ web
TYPE: | Phần tử này chứa kiểu địa chỉ trang web. |
N.7.1.13 Dạng cá nhân
Kiểu này xác định một cá nhân. Các phần tử phụ tương thích với mô tả vCard được định nghĩa trong RFC 2426. Kiểu này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.58 – Sơ đồ của kiểu cá nhân
NAME_TITLE: | Phần tử này chứa danh hiệu của cá nhân. |
PERSON_NAME: | Phần tử này xác định một khuôn khổ để mô tả tên của một người. Tên của một người được bao gồm nhiều thành phần tên (ví dụ, (các) tên gọi và (các) họ). Thứ tự của các phần tử cấu thành tên xác định tên đầy đủ của người. Ví dụ, trong ngôn ngữ mà họ thường được đặt trước tên, sau đó chúng sẽ xuất hiện theo thứ tự này trong tập tin. |
NAME_COMP: | Thành phần tên. Phần tử này chứa một phần đơn (tử) của tên của một người. Một phần tử thành phần tên có thể chứa một tên họ viết tắt chứ không phải là một từ đầy đủ. Để xác định tên đầy đủ của một người, nhiều phần tử cấu thành tên được sử dụng. Phần tử này có chứa một kiểu như quy định dưới đây. |
TYPE: | Kiểu thành phần tên. Phần tử này xác định loại phần tử Tên thành phần. Phần tử này sẽ bao gồm liệu các thành phần tên là một hậu tố, tiền tố, tên gọi hay họ. Giá trị đề nghị và ý nghĩa tương ứng của chúng được liệt kê trong Bảng N.20. Nhiều giá trị sẽ không được quy định trong một kiểu đơn đã sắp đặt. |
Bảng N.20 – Các giá trị kiểu thành phần tên
Giá trị |
Ý nghĩa |
Tiền tố | Một danh hiệu cá nhân, (ví dụ, Tiến sĩ, Ngài) |
Tên gọi | Một cấu trúc tên được đặt cho một cá nhân bởi bố mẹ hoặc là lựa chọn của cá nhân. Đây là giá trị mặc định của kiểu thành phần tên. |
Họ | Một thành phần tên được thừa kế bởi cha mẹ của họ hoặc được thừa nhận bởi hôn nhân. |
Hậu tố | Một vòng tạo ra (ví dụ, Jr., III), các huy chương và giải thưởng, (ví dụ, Q.C., Ph D). |
Tên trước khi lấy chồng | Một thành phần tên của họ của một người phụ nữ trước khi kết hôn. |
NICK_NAME: | Phần tử này xác định một biệt danh của cá nhân. Ví dụ, “Jimmy”. |
JOB_TITLE: | Phần tử này xác định chức danh nghề nghiệp của cá nhân. |
ORGANIZATION: | Phần tử này xác định tổ chức mà cá nhân đó là thành viên. Phần tử tổ chức có thể được chứa trong thành phần con người, hoặc được tham chiếu. |
ORG_REF: | Tham chiếu tổ chức. Một tham chiếu đến tổ chức. Phần tử này là một liên kết đến một trong các phần tử tổ chức trong siêu dữ liệu. |
ADDRESS: | Phần tử này xác định thông tin địa chỉ cho cá nhân. Ví dụ, nó có thể chứa một địa chỉ nhà hoặc địa chỉ nơi làm việc. Nó không nhất thiết phải có các địa chỉ được mô tả trong ảnh, nhưng thay vào đó là thông tin về người đó. Xem kiểu Địa chỉ (N.7.1.9) cho định dạng của phần tử này. |
PHONE: | Số điện thoại. Phần tử này xác định thông tin số điện thoại cho cá nhân. Xem kiểu số điện thoại (N.7.1.10) cho định dạng của phần tử này. |
EMAIL: | Địa chỉ email. Phần tử này xác định một địa chỉ email cho một cá nhân. Xem kiểu địa chỉ email (N.7.1.11) cho định dạng của phần tử này. |
WEB: | Trang web. Phần tử này chứa một trang web cho một cá nhân. Xem kiểu địa chỉ web (N.7.1.12) cho định dạng của phần tử này. |
BIRTH_DATE: | Ngày sinh. Phần tử này xác định ngày sinh của cá nhân. Phần tử này sẽ xác định một ngày chính xác. Đối với thông tin không cụ thể phần tử Nhận xét sẽ được sử dụng. |
AGE: | Phần tử chứa tuổi của một người. |
COMMENT: | Phần tử này xác định thông tin người sử dụng và/hoặc ứng dụng được xác định vượt quá phạm vi của các thuộc tính khác trong kiểu cá nhân. Xem phần tử Nhận xét (N.7.3.1) để biết thêm thông tin về phần tử này. |
ID: | Yếu tố này xác định định danh duy nhất cho cá nhân. |
N.7.1.14 Dạng tổ chức
Kiểu này xác định một tổ chức. Các phần tử phụ tương thích với mô tả vCard được định nghĩa trong RFC 2426. Kiểu này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.59 – Sơ đồ của kiểu tổ chức
ORG_NAME: | Tên tổ chức. Yếu tố này xác định tên của tổ chức. |
ADDRESS: | Phần tử này xác định thông tin địa chỉ cho tổ chức. Nó không nhất thiết phải có các địa chỉ được mô tả trong ảnh, nhưng thay vào đó là thông tin về tổ chức. Xem kiểu Địa chỉ (N.7.1.9) cho định dạng của phần tử này. |
PHONE: | Số điện thoại. Phần tử này xác định thông tin số điện thoại cho cá nhân. Xem kiểu số điện thoại (N.7.1.10) cho định dạng của phần tử này. |
EMAIL: | Địa chỉ email. Phần tử này xác định một địa chỉ email cho một tổ chức. Xem kiểu địa chỉ email (N.7.1.11) cho định dạng của phần tử này. |
WEB: | Trang web. Phần tử này chứa một trang web cho một tổ chức. Xem kiểu địa chỉ web (N.7.1.12) cho định dạng của phần tử này. |
LOGO_FILE: | Phần tử này xác định một tham chiếu đến một tập tin biểu tượng của tổ chức. |
LOGO_FILE_FORMAT: | Phần tử này xác định tên của định dạng tập tin logo. Ví dụ, EPS, JP2 và TNẾUF. |
MIME_TYPE: | Phần tử này xác định loại phương tiện truyền thông Internet của tập tin logo. |
COMMENT: | Phần tử này xác định thông tin người sử dụng và/hoặc ứng dụng được xác định vượt quá phạm vi của các thuộc tính khác trong kiểu cá nhân. Xem phần tử Nhận xét (N.7.3.1) để biết thêm thông tin về phần tử này. |
ID: | Yếu tố này xác định định danh duy nhất cho tổ chức. |
N.7.1.15 Dạng địa điểm
Kiểu này xác định vị trí địa lý của một đối tượng hoặc một cảnh. Ví dụ, nó có thể được sử dụng để mô tả một đối tượng trong một ảnh, hoặc địa điểm của một máy ảnh tại thời điểm chụp. Địa điểm là vị trí địa lý, trong khi vị trí là vị trí của một đối tượng liên quan đến ảnh.
Hình N.60 – Sơ đồ của kiểu địa điểm
COORD_LOC: | Địa điểm tọa độ. Phần tử này xác định chính xác kinh độ, vĩ độ và độ cao của một đối tượng. Cú pháp của phần tử này được quy định tại N.7.1.15.1. |
ADDRESS: | Phần tử này xác định địa điểm của một đối tượng sử dụng một địa chỉ. Xem kiểu Địa chỉ (N.7.1.9) cho định dạng của phần tử này. |
GPS: | Hệ thống định vị toàn cầu. Phần tử này xác định vị trí thông tin nhận được từ một máy thu GPS. Cú pháp của phần tử này được quy định tại N.7.1.15.2. |
COMMENT: | Phần tử này xác định vị trí của một đối tượng mà không thể được mô tả bằng cách sử dụng các phần tử vị trí khác. Ví dụ, “Dưới bàn.” Xem phần tử nhận xét (N.7.3.1) cho định dạng của phần tử này. |
N.7.1.15.1 Tọa độ địa điểm
Phần tử này xác định các vị trí trên mặt đất (độ cao / kinh độ / vĩ độ) của một đối tượng. Nó có thể được sử dụng để mô tả nội dung của một ảnh cùng với vị trí của một máy ảnh. Trong khi địa điểm tọa độ có thể đã đến từ một GPS (và một khối GPS có thể có hoặc không có mặt trong siêu dữ liệu), các giá trị trong địa điểm tọa độ có thể đã đến đối với một số phương tiện khác. Vì lý do này, thông tin địa điểm là một hệ thống tổng quát hơn để lưu trữ các vị trí so với hệ thống GPS. Thông tin địa điểm và dữ liệu GPS gốc được lưu trữ trong các định dạng khác nhau.
GPS là một trong một số phương pháp có thể được sử dụng để xác định một vị trí. Nếu thông tin GPS được điền vào, nó có nghĩa rằng địa điểm tọa độ cũng được xác định. Một đầu đọc sẽ chỉ nhìn vào một nơi duy nhất để xác định địa điểm tọa độ (phần tử này).
Kinh tuyến đi qua Greenwich (Vương quốc Anh) được định nghĩa với giá trị kinh độ l = 0. Kinh độ l của một điểm P trên bề mặt là góc giữa các mặt phẳng qua kinh tuyến và kinh tuyến Greenwich. Kinh độ được tính từ Greenwich lên đến l = ± 180° ở phía đông (+) và phía tây (-).
Vĩ độ j của một điểm P là góc giữa đường bình thường để song song của nó và mặt phẳng xích đạo (l = 0). Trên một quả cầu đường bình thường này sẽ là đường nối liền giữa trung tâm và điểm P. Trên trái đất hình elip đường này sẽ chỉ vượt qua trung tâm nếu P nằm tại đường xích đạo. Vĩ độ tính từ đường xích đạo lên đến j = ± 90° ở phía bắc (+) và phía Nam (-).
Hình N.61 – Sơ đồ của phần tử địa điểm tọa độ
LONGTITUDE: | Phần tử này xác định kinh độ, đại diện trong độ tăng gấp đôi và các phần phân đoạn của độ. Ví dụ: “138,700”, “-122,450.” |
LATITUDE: | Phần tử này xác định vĩ độ, đại diện trong độ tăng gấp đôi và các phần phân đoạn của độ. Ví dụ: “35,383”, “37,767” |
ALTITUDE: | Phần tử này sẽ chứa khoảng cách tính theo mét. 0 là mực nước biển, dương là trên, và âm là dưới. |
N.7.1.15.2 Thông tin GPS nguyên gốc
Thông tin trong các phần tử này dự kiến sẽ được nhập từ một hệ thống GPS và tương thích với NMEA-0138. Vì lý do này, các phần tử không phù hợp với các phần tử siêu dữ liệu khác. Ví dụ, một khoảng cách trên các phần tử GPS có thể được lưu trữ theo dặm, trong khi tất cả các khoảng cách siêu dữ liệu khác được lưu trữ theo mét. Những phần tử này tương thích với Exnếu phiên bản 2.1.
Nếu thông tin vĩ độ, kinh độ và độ cao có mặt trong các thông tin GPS gốc, các phần tử phù hợp trong địa điểm tọa độ sẽ được điền vào.
Yếu tố này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.62 – Sơ đồ của phần tử thông tin GPS gốc
Hình N.63 – Sơ đồ của phần tử thông tin GPS gốc (tiếp theo)
Hình N.64 – Sơ đồ của phần tử thông tin GPS gốc (hết)
GPS_LAT_REF: | Vĩ độ GPS tham khảo. Phần tử này xác định xem vĩ độ GPS là Bắc hay Nam. Bảng N.21 liệt kê các giá trị hợp lệ của phần tử này. |
Bảng N.21 – Các giá trị vĩ độ GPS tham khảo
Giá trị |
Ý nghĩa |
N |
Vĩ độ bắc. |
S |
Vĩ độ nam. |
GPS_LATITUDE: | Vĩ độ GPS. Phần tử này chứa vĩ độ của máy thu GPS. Bảng N.22 liệt kê các giá trị hợp lệ của phần tử này. |
Bảng N.22 – Các giá trị vĩ độ
Giá trị |
Ý nghĩa |
D |
Số độ của vĩ độ. |
M |
Số phút của vĩ độ. |
S |
Số giây của vĩ độ. |
GPS_LONG_REF: | Kinh độ GPS tham khảo. Phần tử này xác định xem kinh độ GPS là Đông hay Tây. Bảng N.21 liệt kê các giá trị hợp lệ của phần tử này. |
Bảng N.23 – Các giá trị kinh độ tham khảo
Giá trị |
Ý nghĩa |
E |
Kinh độ đông. |
W |
Kinh độ tây. |
GPS_LONGITUDE: | Kinh độ GPS. Phần tử này chứa kinh độ của máy thu GPS. Bảng N.24 liệt kê các giá trị hợp lệ của phần tử này. |
Bảng N.24 – Các giá trị kinh độ
Giá trị |
Ý nghĩa |
D |
Số độ của kinh độ. |
M |
Số phút của kinh độ. |
S |
Số giây của kinh độ. |
GPS_ALTITUDE: | Độ cao GPS. Phần tử này chứa độ cao của máy thu GPS. Việc đọc độ cao được tính theo mét so với mực nước biển (geoid). |
GPS TIME: | Thời gian GPS. Phần tử này chứa thời gian của địa điểm GPS được xác định. Phần tử này tính theo giờ trung bình Greenwich (GMT). Đây không nhất thiết phải là thời gian máy ảnh chụp. |
GPS_SATELLITES: | Các vệ tinh GPS. Phần tử này chứa thông tin về các vệ tinh được sử dụng để xác định vị trí máy ảnh. Phần tử này có thể được sử dụng để mô tả số lượng vệ tinh, số ID của chúng, góc nâng, góc phương vị, SNR và thông tin khác. Định dạng không được xác định. |
GPS_STATUS: | Trạng thái GPS. Phần tử này chứa thông tin về các máy thu GPS tại thời điểm chụp ảnh. Bảng N.25 liệt kê các giá trị hợp lệ của phần tử này. |
Bảng N.25 – Các giá trị trạng thái GPS
Giá trị |
Ý nghĩa |
A |
Việc đo lường được tiến hành. |
V |
Việc đo lường bị gián đoạn. |
GPS_MEASURE_MODE: | Chế độ đo GPS. Phần tử này chứa thông tin về chế độ đo được sử dụng để xác định vị trí GPS. Bảng N.26 liệt kê các giá trị hợp lệ của phần tử này. |
Bảng N.26 – Các giá trị chế độ đo GPS
Giá trị |
Ý nghĩa |
2 |
Đo 2 chiều. |
3 |
Đo 3 chiều. |
GPS_DOP: | Mức độ chính xác (DOP) dữ liệu GPS. Phần tử này chứa một giá trị cho biết DOP GPS. Một giá trị HDOP (mức độ ngang chính xác) được ghi trong khi đo hai chiều, và một giá trị PDOP (độ chính xác 3D) được ghi trong khi đo ba chiều. |
GPS_SPEED_REF: | Tốc độ GPS tham khảo. Phần tử này chứa các đơn vị đo lường cho phần tử tốc độ GPS. Bảng N.27 liệt kê các giá trị hợp lệ của phần tử này. |
Bảng N.28 – Các giá trị đơn vị tốc độ GPS tham khảo
Giá trị |
Ý nghĩa |
K |
Km/h |
N |
Hải lý |
GPS_SPEED: | Tốc độ GPS. Phần tử này chứa một giá trị cho thấy tốc độ của máy thu GPS. Các đơn vị giá trị được xác định bởi tốc độ GPS tham khảo. |
GPS_TRACK_REF: | Theo dõi GPS tham khảo. Phần tử này bao gồm các tài liệu tham khảo cho phần tử theo dõi GPS. Bảng N.28 liệt kê các giá trị hợp lệ của phần tử này. |
Bảng N.28 – Các giá trị hướng tham khảo
Giá trị |
Ý nghĩa |
T |
Đúng bắc |
M |
Từ phía bắc. |
GPS_TRACK: | Theo dõi GPS. Phần tử này chứa giá trị tính theo độ cho thấy hướng chuyển động của máy thu GPS. 0 chỉ Bắc và 90 chỉ Đông. |
GPS _IMAGE_DIR_REF: | Hướng ảnh GPS tham khảo. Phần tử này chứa tài liệu tham khảo cho phần tử Hướng ảnh GPS. Bảng N.28 liệt kê các giá trị hợp lệ của phần tử này. |
GPS _IMAGE_DIR: | Hướng ảnh GPS. Phần tử này chứa giá trị tính theo độ cho thấy hướng máy ảnh đang đối mặt tại thời điểm chụp ảnh. 0 chỉ Bắc và 90 chỉ Đông. |
GPS_MAP_DATUM: | Dữ kiện bản đồ GPS. Phần tử này xác định dữ liệu khảo sát đo đạc được dùng bởi máy thu GPS. Ví dụ, nếu dữ liệu khảo sát bị giới hạn Nhật Bản, giá trị của thẻ này là “TOKYO” hoặc “WSG-84.” |
GPS_DEST_LAT_REF: | Vĩ độ đích GPS tham khảo. Phần tử này xác định xem vĩ độ đích GPS là Bắc hay Nam. Bảng N.21 liệt kê các giá trị hợp lệ của phần tử này. |
GPS_DEST_LATITUDE: | Vĩ độ đích. Phần tử này chứa vĩ độ đích của máy thu GPS. Bảng N.22 liệt kê các giá trị hợp lệ của phần tử này. |
GPS_DEST_LONG_REF: | Kinh độ đích GPS tham khảo. Phần tử này xác định xem kinh độ đích GPS là Đông hay Tây. Bảng N.23 liệt kê các giá trị hợp lệ của phần tử này. |
GPS_DEST_LONGITUDE: | Kinh độ đích. Phần tử này chứa kinh độ đích của máy thu GPS. Bảng N.24 liệt kê các giá trị hợp lệ của phần tử này. |
GPS_DEST_BEARING_REF: | GPS Destination Bearing Reference. Phần tử này chứa tài liệu tham khảo cho phần tử GPS Destination Bearing. Bảng N.28 liệt kê các giá trị hợp lệ của phần tử này. |
GPS_DEST_BEARING: | GPS Destination Bearing. Phần tử này chứa giá trị tính theo độ cho thấy hướng của các điểm đến từ máy thu GPS. 0 chỉ Bắc và 90 chỉ Đông. |
GPS_DEST_DISTANCE_REF: | Khoảng cách đích GPS tham khảo. Phần tử này chứa các đơn vị đo lường cho phần tử Khoảng cách đích GPS. Bảng N.29 liệt kê các giá trị hợp lệ của phần tử này. |
Bảng N.29 – Các giá trị đơn bị khoảng cách đích GPS tham khảo
Giá trị |
Ý nghĩa |
K |
Km/h |
N |
Hải lý |
GPS_DEST_DISTANCE: | Khoảng cách đích GPS. Phần tử này chứa một giá trị cho thấy khoảng cách đến đích từ máy thu GPS. Các đơn vị giá trị được xác định bởi khoảng cách đích GPS tham khảo. |
N.7.1.16 Dạng hướng
Đây là kiểu xác định một nhóm ba chiều. Trong khi kiểu này chủ yếu được sử dụng để xác định hướng một camera đang đối mặt, nó cũng có thể được sử dụng để xác định thông tin về một đối tượng trong một bức ảnh khoa học ví dụ. Khi tính toán hướng máy ảnh đang đối mặt, đầu tiên sự chệch đường được áp dụng, sau đó sân, sau đó cuộn. Kiểu này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.65 – Sơ đồ của kiểu hướng
YAW: | Phần tử này là hướng thiết bị chụp đang đối mặt. Các phần tử được đo bằng độ. Bắc là 0, Đông là 90, Nam 180 và Tây là -90. |
PITCH: | Phần tử này là một thước đo của góc độ cao của thiết bị chụp. Phần tử này là một giá trị đúp giữa -90 và 90, cũng đo bằng độ. 0 đối mặt ngang. 90 đang đối mặt theo chiều dọc thẳng lên trên, và theo chiều dọc xuống dưới -90. |
ROLL: | Phần tử này là một thước đo của góc quay của thiết bị chụp. Phần tử này là một giá trị đúp giữa -180 và 180, cũng đo bằng độ. 0 đối mặt ngang. 90 nơi mà các thiết bị có thể xoay chiều kim đồng hồ và bên trái của thiết bị được hướng lên trên, và -90 nơi mà các thiết bị có thể xoay ngược chiều kim đồng hồ. 180 là lộn ngược. |
COMMENT: | Phần tử này chỉ thông tin người sử dụng và/hoặc ứng dụng được xác định vượt quá phạm vi của các thuộc tính khác trong các kiểu hướng. Ví dụ, “Trở lên”, “Bên trái.” Xem phần tử nhận xét (N.7.3.1) để biết thêm thông tin về phần tử này. |
N.7.1.17 Dạng vị trí
Kiểu này được sử dụng để xác định vị trí của một đối tượng, trong một ảnh. Kiểu Vị trí có thể là một trong các cách sau:
– Một điểm đơn x,y.
– Một khu vực hình chữ nhật (xác định như một x, y, chiều rộng và chiều cao).
– Một tập hợp các splines đại diện cho một khu vực của ảnh.
– Một phần tử nhận xét văn bản tự do.
Ảnh được mô tả trong một hệ Đề-các, với trục ngang X và chỉ vào bên phải, trục thẳng đứng Y và hướng xuống, và gốc ở góc trên bên trái. Tỉ lệ chiều cao của ảnh được chuẩn hóa đến 1.0. Để giữ tỉ lệ của trục X và trục Y giống nhau, độ rộng ảnh (R) là tỉ lệ của nó (chiều rộng/chiều cao). Do đó, một phần vuông của bất kỳ ảnh nào có chiều rộng và chiều cao bằng nhau trong hệ tọa độ này. Hệ tọa độ siêu dữ liệu đề cập đến khu vực ảnh trên lưới tham khảo theo quy định tại ITU-T T.800 | ISO/IEC 15444-1. Xem hình B.1 trong ITU-T T.800 | ISO/IEC 15444-1 cho một minh họa về khu vực ảnh. Tọa độ (0, 0) đề cập đến phía trên bên trái của điểm ảnh (XOsiz, YOsiz) và tọa độ (R, 1) đề cập đến góc dưới bên phải của điểm ảnh (Xsiz-1, Ysiz-1) trên lưới tham khảo nơi XOsiz, YOsiz, Xsiz và Ysiz là những giá trị của các trường tương ứng trong các điểm đánh dấu SIZ (xem A.2.3) trong dòng mã. Các tọa độ khác bản đồ tuyến tính trong khu vực ảnh này.
Thông tin này có thể trở nên vô ích nếu ảnh bị cắt hoặc chế tác. Xem kiểu địa điểm (N.7.1.15) cho sự khác biệt giữa các kiểu vị trí và địa điểm.
Hình N.66 – Sơ đồ của kiểu vị trí
POINT: | Điểm đơn. Phần tử này xác định một điểm đơn trong hệ tọa độ. Xem kiểu điểm (N.7.1.18) để biết thêm thông tin về phần tử này. |
RECT: | Vùng hình chữ nhật. Phần tử này xác định một vùng hình chữ nhật trong hệ tọa độ. Xem kiểu Rect (N.7.1.19) để biết thêm thông tin về phần tử này. |
REGION: | Vùng tùy ý. Phần tử này xác định một vùng tùy ý. Xem loại vùng (N.7.1.20) để biết thêm thông tin về phần tử này. |
COMMENT: | Phần tử này có thể mô tả vị trí của một đối tượng kém chính xác hơn so với một trong những phương pháp trên. Ví dụ, phần tử này có thể chứa “dưới góc trái” hay “thứ hai từ bên trái ở hàng đầu.” Xem yếu tố nhận xét (N.7.3.1) để biết thêm thông tin về phần tử này. |
N.7.1.18 Dạng điểm
Kiểu này xác định chi tiết về một điểm đơn trên một ảnh. Kiểu này được sử dụng để mô tả một điềm đơn trong hệ tọa độ. Kiểu này có chứa các phần tử phụ được liệt kê dưới đây.
Hình N.67 – Sơ đồ của kiểu điểm
X: Phần tử này xác định tọa độ X của điểm.
Y: Phần tử này xác định tọa độ Y của điểm.
N.7.1.19 Dạng tọa độ hình chữ nhật
Kiểu này xác định chi tiết về một vùng hình chữ nhật trên một ảnh. Kiểu này được sử dụng để mô tả một vùng hình chữ nhật trong hệ thống tọa độ. Xem kiểu điểm (N.7.1.18) cho định dạng cơ bản của kiểu này. Ngoài ra, kiểu này phải chứa các phần tử phụ được liệt kê dưới đây.
Hình N.68 – Sơ đồ của kiểu điểm
X: | Bên trái hình chữ nhật. |
Y: | Bên trên hình chữ nhật. |
WIDTH: | Chiều rộng của hình chữ nhật (bên phải của X). |
COMMENT: | Chiều cao của hình chữ nhật (bên dưới Y). |
N.7.1.20 Dạng miền
Kiểu này xác định chi tiết về một miền bất kỳ trên ảnh. Kiểu này bao gồm một điểm bắt đầu và một hoặc nhiều phân đoạn. Mỗi phân đoạn có thể là một đường thẳng (xác định sử dụng một điểm), hoặc một spline.
Trường hợp vùng tùy ý được chỉ định, một vùng hình chữ nhật cũng xác định (đó là hướng ngược giới hạn của vùng tùy ý). Một đầu đọc hoặc trình biên tập siêu dữ liệu JPX đọc siêu dữ liệu tuân thủ JPX tiêu chuẩn có thể lựa chọn không sử dụng vùng tùy ý, thậm chí nếu vùng hình chữ nhật được sử dụng.
Kiểu này chứa các phần tử phụ được liệt kê dưới đây.
Hình N.69 – Sơ đồ của kiểu vùng
POINT: | Điểm bắt đầu: Đây là điểm khởi đầu của spline trong hệ tọa độ. Xem kiểu điểm (N.7.1.18) cho định dạng của phần tử này. |
POINT: | Phần tử này xác định một dòng bắt đầu từ cuối của spline trước và kết thúc tại điểm mới. Xem kiểu điểm (N.7.1.18) cho định dạng của phần tử này. |
SPLINE: | Phần tử này xác định một đường cong Bezier bắt đầu từ cuối của spline trước, và kết thúc tại điểm cuối mới (x, y), với x1, y1 và x2, y2 là các điểm điều khiển đầu tiên và thứ hai của spline tương ứng. |
N.7.1.21 Dạng chi tiết sản phẩm
Kiểu này xác định chi tiết về một sản phẩm (phần cứng hoặc phần mềm). Bằng cách kết hợp ba phần tử, một giá trị duy nhất được tạo ra. Kiểu này có thể chứa các phần tử phụ được liệt kê dưới đây.
Hình N.70 – Sơ đồ của kiểu chi tiết sản phẩm
MANUFACTURER: | Tên nhà sản xuất. Phần tử này xác định tên nhà sản xuất hoặc nhà cung cấp của sản phẩm. Nó được đề nghị để thiết lập tên nhà sản xuất được hiển thị trên thiết bị. Xem kiểu Tổ chức (N.7.1.14) cho định dạng của phần tử này. |
MODEL: | Tên mẫu. Phần tử này xác định các mẫu tên hoặc số của sản phẩm. |
SERIAL: | Số sê-ri. Phần tử này xác định số sê-ri của sản phẩm. |
VERSION: | Số phiên bản. Phần tử này xác định số phiên bản của sản phẩm. |
N.7.2 Các thuộc tính được định nghĩa
N.7.2.1 Thuộc tính ngôn ngữ
Thuộc tính được định dạng theo RFC 3066. Khi một phần tử siêu dữ liệu có một thuộc tính ngôn ngữ, nó xác định ngôn ngữ mà các siêu dữ liệu được lưu trữ. Tiếng Anh (ví dụ, “en”) được giả định nếu ngôn ngữ không được xác định.
Trường hợp một phần tử xác định một thuộc tính ngôn ngữ, và cả các phần tử phụ, ngôn ngữ của các phần tử phụ giống như các phần tử chứa đựng trừ khi thuộc tính ngôn ngữ được quy định riêng trong các phần tử phụ.
Hình N.71 – Sơ đồ của thuộc tính ngôn ngữ
xml:lang: | Phần tử này chứa một chuỗi các giá trị tuân thủ RFC 3066. Cú pháp của phần tử này sẽ phù hợp với định dạng Nhận dạng ngôn ngữ của XML 1.0. |
N.7.2.2 Thuộc tính nhãn thời gian
Khi một phần tử siêu dữ liệu chứa một thuộc tính dấu thời gian, nó xác định thời gian mà siêu dữ liệu được tạo ra. Trường hợp một phần tử xác định một thuộc tính dấu thời gian, và cả các phần tử phụ, dấu thời gian của các phần tử phụ giống như phần tử chứa đựng trừ khi thuộc tính dấu thời gian được quy định riêng trong các phần tử phụ.
Hình N.72 – Sơ đồ của thuộc tính dấu thời gian
TIMESTAMP: Phần tử này chứa một chuỗi tuân thủ ISO 8601.
N.7.3 Các phần tử được định nghĩa
N.7.3.1 Phần tử chú giải
Phần tử chú giải được sử dụng để xác định thông tin bổ sung cho các phần tử nó chứa mà không thể được mô tả bằng cách khác trong siêu dữ liệu được định nghĩa. Nó được khuyến cáo rằng phần tử nhận xét được sử dụng như một phương sách cuối cùng khi các phần tử siêu dữ liệu khác không phù hợp để lưu trữ một phần cụ thể của siêu dữ liệu.
Nội dung của phần tử này được nhằm mục đích để lưu trữ dữ liệu con người có thể đọc được. Lưu trữ dữ liệu không phải con người có thể đọc được được thực hiện bằng cách sử dụng các phương pháp mở rộng siêu dữ liệu khác.
Hình N.73 – Sơ đồ của phần tử nhận xét
N.8 Định nghĩa dạng tài liệu siêu dữ liệu mở rộng JPX
N.9 Sơ đồ XML siêu dữ liệu mở rộng JPX
Phụ lục O
(Tham khảo)
Các ví dụ và hướng dẫn, phần mở rộng
(Phụ lục là phần tích hợp với tiêu chuẩn)
O.1 Các ví dụ phân tách tùy ý
Hình O.1 cho thấy một ví dụ phân giải sóng con (sóng con) có thể đạt được thông qua Tiêu chuẩn này cùng với chuỗi cú pháp thích hợp dθ(), dR() VÀ dS() (xem Phụ lục F). Các hình O.2 đến O.14 cho thấy làm thế nào mỗi phần tử chuỗi cú pháp được diễn giải để có được cấu trúc phân hủy hoàn toàn trong hình O.1, với các phần tử nhấn mạnh rằng dẫn đến giai đoạn hiển thị. Các nhãn băng con này sau đó được đưa vào như là biến θcnt từ hình F.13 đạt giá trị tối đa của nó hoặc một phần tử cú pháp 0 được gặp phải trong chuỗi dS(). Hình O.15 cho thấy một sự phân hủy phức tạp hơn được phát triển bởi Cục điều tra Liên bang Hoa Kỳ (FBI) cho việc nén của các ảnh dấu vân tay và các hình O.16 đến O.30 cho thấy việc giải thích các phần tử cú pháp. Để giảm bớt số lượng nhiều, hầu hết các băng con trong ba độ phân giải thấp nhất của hình O.15 được dán nhãn với các chỉ số viết nhỏ cho thấy các nhãn băng con thực tế thông qua bảng O.1. Cuối cùng, hình O.31 cho thấy cái được gọi là sự phân giải SPACL (chữ viết tắt của “Phòng thí nghiệm xử lý và mã hóa tín hiệu” tại Đại học Arizona).
a3XL |
a2HX |
a1HL:LX:XL |
a1HL:HX |
a3XH |
a1HL:LX:XH |
||
a1LH:XL |
a1HH:XL |
||
a1LH:XH |
a1HH:XH:LX |
a1HH:XH:HX |
|
|
|
T.801_FO-1 |
Hình O.1 – Sự phân giải sóng con mẫu: NL = 3; lR = 3; dR() = 123; lθ = 2, dθ() = 31; lS = 9, dS() = 320300203
|
|
|
|
|
T.801_FO-2 |
Hình O.2 – Sự phân giải sóng con mẫu: NL = 3; lR = 3; dR() = 123; lθ = 2, dθ() = 31; lS = 9, dS() = 320300203
|
|
|
|
|
|
|
T.801_FO-3 |
Hình O.3 – Sự phân giải sóng con mẫu: NL = 3; lR = 3; dR() = 123; lθ = 2, dθ() = 31; lS = 9, dS() = 320300203
|
|
|
|
||
|
|
|
|
T.801_FO-4 |
Hình O.4 – Sự phân giải sóng con mẫu: NL = 3; lR = 3; dR() = 123; lθ = 2, dθ() = 31; lS = 9, dS() = 320300203
|
|
|
|
||
|
|
|
|
||
|
T.801_FO-5 |
Hình O.5 – Sự phân giải sóng con mẫu: NL = 3; lR = 3; dR() = 123; lθ = 2, dθ() = 31; lS = 9, dS() = 320300203
|
|
|
|
|
|||
|
|
||
a1HH:XH:LX |
a1HH:XH:HX |
||
|
T.801_FO-6 |
Hình O.6 – Sự phân giải sóng con mẫu: NL = 3; lR = 3; dR() = 123; lθ = 2, dθ() = 31; lS = 9, dS() = 320300203
|
|
|
|
|
|||
|
a1HH:XL |
||
a1HH:XH:LX |
a1HH:XH:HX |
||
|
T.801_FO-7 |
Hình O.7-Sự phân giải sóng con mẫu: NL = 3; lR = 3; dR() = 123; lθ = 2, dθ() = 31; lS = 9, dS() = 320300203
|
|
|
|
|
|||
|
a1HH:XL |
||
|
a1HH:XH:LX |
a1HH:XH:HX |
|
|
T.801_FO-8 |
Hình O.8 – Sự phân giải sóng con mẫu: NL = 3; lR = 3; dR() = 123; lθ = 2, dθ() = 31; lS = 9, dS() = 320300203
|
|
|
|
|
|||
|
a1HH:XL |
||
a1LH:XH |
a1HH:XH:LX |
a1HH:XH:HX |
|
|
T.801_FO-9 |
Hình O.9 – Sự phân giải sóng con mẫu: NL = 3; lR = 3; dR() = 123; lθ = 2, dθ() = 31; lS = 9, dS() = 320300203
|
|
|
|
|
|||
a1LH:XL |
a1HH:XL |
||
a1LH:XH |
a1HH:XH:LX |
a1HH:XH:HX |
|
|
T.801_FO-10 |
Hình O.10 – Sự phân giải sóng con mẫu: NL = 3; lR = 3; dR() = 123; lθ = 2, dθ() = 31; lS = 9, dS() = 320300203
|
|
|
|
|
|
||||
a1LH:XL |
a1HH:XL |
|||
a1LH:XH |
a1HH:XH:LX |
a1HH:XH:HX |
||
|
T.801_FO-11 |
|||
Hình O.11 – Sự phân giải sóng con mẫu: NL = 3; lR = 3; dR() = 123; lθ = 2, dθ() = 31; lS = 9, dS() = 320300203
|
|
|
a1HL:HX |
|
|
|
|||
a1LH:XL |
a1HH:XL |
|||
a1LH:XH |
a1HH:XH:LX |
a1HH:XH:HX |
||
|
T.801_FO-12 |
|||
Hình O.12 – Sự phân giải sóng con mẫu: NL = 3; lR = 3; dR() = 123; lθ = 2, dθ() = 31; lS = 9, dS() = 320300203
|
|
a1HL:LX:XL |
a1HL:HX |
|
|
a1HL:LX:XH |
|||
a1LH:XL |
a1HH:XL |
|||
a1LH:XH |
a1HH:XH:LX |
a1HH:XH:HX |
||
|
T.801_FO-13 |
|||
Hình O.13 – Sự phân giải sóng con mẫu: NL = 3; lR = 3; dR() = 123; lθ = 2, dθ() = 31; lS = 9, dS() = 320300203
a3XL |
a2HX |
a1HL:LX:XL |
a1HL:HX |
|
a3XH |
a1HL:LX:XH |
|||
a1LH:XL |
a1HH:XL |
|||
a1LH:XH |
a1HH:XH:LX |
a1HH:XH:HX |
||
|
T.801_FO-14 |
|||
Hình O.14-Sự phân giải sóng con mẫu: NL = 3; lR = 3; dR() = 123; lθ = 2, dθ() = 31; lS = 9, dS() = 320300203
Hình O.15 – Sự phân giải FBI: NL = 5; lR = 0; dR() = 0 (khi lR= 0, lR và dR() được thiết lập lại trong hình F.11 để lR = 5 và dR() = 11111); lθ = 4, dθ() = 2321; lS = 17, dS() = 11101111111111111
Bảng 0.1 – Các nhãn băng con cho hình 0.15
Nhãn viết nhỏ |
Nhãn băng con |
|
Nhãn viết nhỏ |
Nhãn băng con |
|
Nhãn viết nhỏ |
Nhãn băng con |
a1 |
a5LL |
|
a18 |
a3HH:LH |
|
a35 |
a2HL:HH:HH |
a2 |
a5HL |
|
a19 |
a3HH:HH |
|
a36 |
a2LH:LL:LL |
a3 |
a5LH |
|
a20 |
a2HL:LL:LL |
|
a37 |
a2LH:LL:HL |
a4 |
a5HH |
|
a21 |
a2HL:LL:HL |
|
a38 |
a2LH:LL:LH |
a5 |
a4HL |
|
a22 |
a2HL:LL:LH |
|
a39 |
a2LH:LL:HH |
a6 |
a4LH |
|
a23 |
a2HL:LL:HH |
|
a40 |
a2LH:HL:LL |
a7 |
a4HH |
|
a24 |
a2HL:HL:LL |
|
a41 |
a2LH:HL:HL |
a8 |
a3HL:LL |
|
a25 |
a2HL:HL:HL |
|
a42 |
a2LH:HL:LH |
a9 |
a3HL:HL |
|
a26 |
a2HL:HL:LH |
|
a43 |
a2LH:HL:HH |
a10 |
a3HL:LH |
|
a27 |
a2HL:HL:HH |
|
a44 |
a2LH:LH:LL |
a11 |
a3HL:HH |
|
a28 |
a2HL:LH:LL |
|
a45 |
a2LH:LH:HL |
a12 |
a3LH:LL |
|
a29 |
a2HL:LH:HL |
|
a46 |
a2LH:LH:LH |
a13 |
a3LH:HL |
|
a30 |
a2HL:LH:LH |
|
a47 |
a2LH:LH:HH |
a14 |
a3LH:LH |
|
a31 |
a2HL:LH:HH |
|
a48 |
a2LH:HH:LL |
a15 |
a3LH:HH |
|
a32 |
a2HL:HH:LL |
|
a49 |
a2LH:HH:HL |
a16 |
a3HH:LL |
|
a33 |
a2HL:HH:HL |
|
a50 |
a2LH:HH:LH |
a17 |
a3HH:HL |
|
a34 |
a2HL:HH:LH |
|
a51 |
a2LH:HH:HH |
|
|
|
|
T.801_FO-16
Hình O.16 – Sự phân giải FBI: NL = 5; lR = 5 và dR() = 11111; lθ = 4, dθ() = 2321; lS = 17, dS() = 11101111111111111
|
|
|
|
|
|
|
|
T.801_FO-17
Hình O.17-Sự phân giải FBI: NL = 5; lR = 5 và dR() = 11111; lθ = 4, dθ() = 2321; lS = 17, dS() = 11101111111111111
|
|
|
|
|
|
|
|
||||
|
|
||||
|
|
||||
|
|
||||
|
|
T.801_FO-18
Hình O.18 – Sự phân giải FBI: NL = 5; lR = 5 và dR() = 11111; lθ = 4, dθ() = 2321; lS = 17, dS() = 11101111111111111
Hình O.19 – Sự phân giải FBI: NL = 5; lR = 5 và dR() = 11111; lθ = 4, dθ() = 2321; lS = 17, dS() = 11101111111111111
Hình O.20 – Sự phân giải FBI: NL = 5; lR = 5 và dR() = 11111; lθ = 4, dθ() = 2321; lS = 17, dS() = 11101111111111111
Hình 0.21 – Sự phân giải FBI: NL = 5; lR = 5 và dR() = 11111; lθ = 4, dθ() = 2321; lS = 17, dS() = 11101111111111111
Hình O.22 – Sự phân giải FBI: NL = 5; lR = 5 và dR() = 11111; lθ = 4, dθ() = 2321; lS = 17, dS() = 11101111111111111
Hình O.23 – Sự phân giải FBI: NL = 5; lR = 5 và dR() = 11111; lθ = 4, dθ() = 2321; lS = 17, dS() = 11101111111111111
Hình O.24-Sự phân giải FBI: NL = 5; lR = 5 và dR() = 11111; lθ = 4, dθ() = 2321; lS = 17, dS() = 11101111111111111
Hình O.25- Sự phân giải FBI: NL = 5; lR = 5 và dR() = 11111; lθ = 4, dθ() = 2321; lS = 17, dS() = 11101111111111111
Hình O.26-Sự phân giải FBI: NL = 5; lR = 5 và dR() = 11111; lθ = 4, dθ() = 2321; lS = 17, dS() = 11101111111111111
Hình O.27-Sự phân giải FBI: NL = 5; lR = 5 và dR() = 11111; lθ = 4, dθ() = 2321; lS = 17, dS() = 11101111111111111
Hình O.28 – Sự phân giải NL = 5; lR = 5 và dR() = 11111; lθ = 4, dθ() = 2321; lS = 17, dS() = 11101111111111111
Hình O.29 – Sự phân giải FBI: NL = 5; lR = 5 và dR() = 11111; lθ = 4, dθ() = 2321; lS = 17, dS() = 11101111111111111
Hình O.30 – Sự phân giải FBI: NL = 5; IR = 5 và dR() = 11111; lθ = 4, dθ() = 2321; Is = 17, ds() = 11101111111111111
Hình O.31 – Sự phân giải SPACL: NL = 4; lθ = 2, dθ() = 21; lR = 0, ls = 0
O.2 Quy ước khối ảnh lẻ thông thấp đầu tiên (OTLPF)
Mục này cho thấy làm thế nào để giảm sự giả tường biên ô vuông bằng cách sử dụng quy ước OTLPF và làm thế nào để thực hiện quy ước OTLPF bằng cách chọn tùy chọn TSSO với các tùy chọn SSO và TBDWT đã tắt.
Nó đã được chứng minh [10] rằng, sự giả tưởng biên ô vuông có thể được giảm đáng kể bằng cách tránh những hệ số thông cao lúc bắt đầu và kết thúc của các ô vuông. Theo định nghĩa trong ITU-T Rec. T.800 | ISO/IEC 15444-1, các hệ số thông thấp luôn nằm trên tọa độ chẵn và các hệ số thông cao nằm trên các tọa độ lẻ của lưới tham khảo không phụ thuộc vào vị trí ảnh và ô vuông. Do đó, để giảm bớt sử giả tưởng biên ô vuông các ô vuông nên bắt đầu và kết thúc tại các tọa độ chẵn của lưới tham chiếu. Tuy nhiên, điều này không thể được thực hiện mà không chọn tùy chọn TSSO như thể hiện dưới đây.
O.2.1 Ví dụ 1 (các kích cỡ khối ảnh chẵn)
Giả sử một ảnh của 512 x 512 mẫu, với kích thước ô vuông của XTsiz = YTsiz 128 và XOsiz = YOsiz = XTOsiz = YTOsiz = 0. Nếu TSSO không được chọn, tọa độ biên ô vuông cho mỗi ô vuông theo các hướng x và y là:
tx0x (x, q) = ty0 (p, y) = {0, 128, 256, 384} (O-1)
tx1 (x, q) – 1 = ty1 (p, y) – 1 = {127, 255, 383, 511} (O-2)
Mỗi ô vuông bắt đầu với một tọa độ chẵn ở phía trên, góc trái (phương trình O-1) và kết thúc bằng một tọa độ lẻ ở phía dưới, góc phải (phương trình O-2). Do đó tất cả các ô vuông bắt đầu với hệ số thông thấp và kết thúc với hệ số thông cao trong cả hai hướng x và y. Điều này sẽ gây ra các lỗi biên ô vuông ở ranh giới phải và phía dưới của mỗi khối.
O.2.2 Ví dụ 2 (các kích cỡ khối ảnh lẻ)
Đối với các điều kiện như quy định tại ví dụ 1 nhưng với kích thước ô vuông của XTsiz = YTsiz = 129, sau đây tồn tại:
xt0 (x, q) = ty0 (p, y) = {0, 129, 257, 387} (O.3)
tx1 (x, q) – 1 = ty1 (p, y – 1) = {128, 257, 383, 511} (O-4)
Điều này cho thấy ô vuông đầu tiên bắt đầu (0, 0) và kết thúc (128, 128) với tọa độ chẵn do đó có hệ số thông thấp ở biên cho ô vuông này. Điều này sẽ tạo ra một ô vuông được xây dựng lại tốt hơn là các lỗi tại tất cả bốn biên bây giờ có cùng độ lớn như những gì bên trong ô vuông, ô vuông tiếp theo bắt đầu (129, 0) và kết thúc (257, 128) ở tọa độ lẻ do đó có hệ số thông cao tại biên ô vuông. Điều này dẫn đến các lỗi lớn ở biên ô vuông xây dựng lại. Tình trạng này luân phiên cho tất cả các ô vuông trên toàn bộ ảnh.
Do đó có thể thấy rằng, bằng cách sử dụng một kích thước ô vuông lẻ và có hệ số thông thấp đầu tiên, ô vuông sẽ tự động kết thúc với hệ số thông thấp và sự giả tưởng ở biên ô vuông có thể được giảm đáng kể. Kỹ thuật này được gọi là quy ước ô vuông lẻ thông thấp đầu tiên (OTLPF).
Ví dụ tiếp theo cho thấy cách TSSO có thể được sử dụng để làm cho mọi ô vuông TSSO đáp ứng hai điều kiện của kích thước ô vuông lẻ và thông thấp đầu tiên.
0.2.3 Ví dụ 3 (TSSO/OTLPF)
Đối với các điều kiện giống nhau như quy định tại ví dụ 1, kích thước ô vuông là XTsiz = YTsiz = 128, nhưng bây giờ các ô vuông được chồng lên nhau bên phải và phía dưới cùng cho một mẫu. Do đó,
tx0 (x, q) = ty0 (p, y) = {0, 128, 256, 384} (O–5)
tx1 (x, q) – 1 = ty1 (p, y) – 1 = {128, 256, 384, 511} (O–6)
Ô vuông đầu tiên bắt đầu (0, 0) và kết thúc (128, 128) với tọa độ chẵn và, vì sự chồng chéo, ô vuông tiếp theo cũng bắt đầu (128, 0) và kết thúc (256, 128) tại tọa độ chẵn. Bằng cách này, mỗi ô vuông bắt đầu và kết thúc tại tọa độ chẵn trên lưới tham chiếu. Như tất cả các ô vuông bây giờ bắt đầu và kết thúc tại tọa độ chẵn, mỗi ô vuông bắt đầu và kết thúc với hệ số thông thấp ở cả bốn biên ô vuông và sự giả tưởng biên ô vuông sẽ được giảm đáng kể. Ngoại lệ trong trường hợp này sẽ là ô vuông cuối cùng bên tay phải và/hoặc dưới cùng của ảnh. Kể từ khi chúng đang ở trên biên của ảnh, không có mẫu bổ sung cho sự chồng chéo.
Để đạt được mức giảm tốt nhất trong sự giả tưởng biên khối ản, cần thiết để lựa chọn các thông số ô vuông như sau:
trong đó m và n là các số nguyên lớn hơn không, NL là mức độ phân giải, Rx và Ry là bội số chung nhỏ nhất của các nhân tố mẫu phụ Xrsizi và Yrsizi tương ứng cho tất cả các thành phần (thường được sử dụng 4: 1: 1 định dạng Rx= Ry = 2).
O.3 Ví dụ tập hợp nhiều thành phần
Hình O.32 mô tả hai phép biến đổi áp dụng cho hai tập hợp thành phần, với thành phần đầu vào liệt kê Cmcc0 = [4, 1, 5], Cmcc1 = [2, 3, 0] và thành phần đầu ra liệt kê Wmcc0 = [5, 4, 3, 6 ], Wmcc1 = [2, 1, 0]. Ví dụ này minh họa một bước biến đổi với 6 đầu vào và 7 đầu ra mà hoán vị các thành phần đầu vào và đầu ra.
Hình O.32 – Ví dụ tập hợp thành phần
O.3.1 Ví dụ biến đổi nhiều thành phần trên cơ sở ma trận
Ví dụ trình bày ở đây các bài tập của sự linh hoạt và chức năng của các quá trình biến đổi nhiều thành phần được trình bày trong Phụ lục J và cú pháp hỗ trợ của chúng trong Phụ lục A. Chúng ta xem xét ở đây không chỉ là cú pháp dòng mã được yêu cầu bởi các bộ giải mã để giải thích đúng dòng mã, mã còn một số các quyết định một bộ mã hóa có thể phải đối mặt.
Ảnh nhiều thành phần giả định chúng ta muốn mã hóa là một ảnh đa phổ 7 thành phần. Hình O.33 cho thấy các thành phần ảnh ban đầu được mã hóa trong các dòng mã. Các bộ mã hóa phân tích ảnh nhiều thành phần quyết định rằng các thành phần 0, 1, 2, và 4 sẽ được xử lý với một biến đổi không tương quan dựa trên ma trận, các thành phần 5 và 3 với một biến đổi phụ thuộc dựa trên ma trận, và thành phần 6 không có biến đổi. Hơn nữa, bộ mã hóa quyết định để dự đoán thành phần 3 từ phần 5 trong biến đổi phụ thuộc; chỉ các lỗi dự đoán còn lại cho thành phần 3 có mặt trong dòng mã.
Hình O.33 – Các thành phần ảnh ban đầu
Hình O.34 minh họa những sự lựa chọn xử lý được thực hiện bởi bộ mã hóa. Cả hai danh sách tập hợp thành phần đầu vào và đầu ra đã được hoán vị trong quá trình biến đổi nhiều thành phần chuyển tiếp. Các ma trận biến đổi nhiều thành phần và các danh sách tập hợp thành phần đầu vào và đầu ra mà bộ mã hóa sử dụng không có mặt trong dòng mã nén. Thay vào đó, nó có trách nhiệm của bộ mã hóa để tạo ra sự không tương quan đảo ngược và các ma trận biến đổi phụ thuộc cần thiết, cũng như các danh sách tập hợp thành phần thích hợp, như vậy là bộ giải mã có thể đảo ngược thành công quá trình biến đổi.
Hình O.34 – Quyết định biến đổi nhiều thành phần bộ giải mã
Hình O.34 là bộ giải mã tương tự để hình J.2 trong đó chỉ có một bước của biến đổi nhiều thành phần. Trong bước biến đổi đơn, có ba hoạt động riêng biệt được thực hiện trên một phần nhỏ của các thành phần ảnh đầu vào. Nếu một bộ mã hóa mong muốn tạo ra các thành phần mới không có mặt trong ảnh gốc và đặt chúng trong dòng mã, nó có thể đơn giản làm như vậy. Nếu một bộ mã hóa mong muốn có một bộ giải mã để tạo ra các thành phần bổ sung không có trong ảnh gốc hoặc trong dòng mã, điều này có thể được thực hiện bằng thao tác của không tương quan đảo ngược và/hoặc các ma trận biến đổi phụ thuộc và các danh sách tập hợp thành phần.
Phương trình J-13 mô tả việc xử lý biến đổi phụ thuộc chuyển tiếp của bộ mã hóa. Trong các phương trình, W cho thấy một thành phần ảnh đầu vào (bản gốc), và C là một thành phần đã biến đổi được thông qua với phương tiện biến đổi sóng con không gian. Các thành phần này là cuối cùng được mã hóa trong dòng mã. Phương trình J-3 mô tả việc xử lý biến đổi không tương quan chuyển tiếp của bộ mã hóa. Trong các phương trình, W một lần nữa cho thấy một thành phần ảnh đầu vào, và C là một thành phần đã biến đổi được thông qua với phương tiện biến đổi sóng con không gian.
Sự đảo ngược của những biến đổi bởi bộ giải mã có thể được thực hiện với ba tập hợp thành phần được nhóm vào một giai đoạn chuyển đổi duy nhất. Một đảo ngược như vậy sẽ không phức tạp. Tuy nhiên, để làm ví dụ thú vị hơn, chúng ta sẽ có một bộ mã hóa cung cấp thông tin cho việc tạo ra bốn thành phần bổ sung (để thực hiện tổng cộng 11 thành phần đầu ra). Các thành phần này bao gồm một thành phần đại diện toàn sắc của ảnh đa phổ và ba thành phần đại diện sai màu của ảnh đa phổ. Mặc dù chỉ có bảy thành phần được mã hóa trong dòng mã, bộ giải mã sẽ sản xuất 11 trong quá trình hai giai đoạn biến đổi nhiều thành phần đảo ngược. Chúng ta sẽ tiếp tục yêu cầu bốn thành phần bổ sung là bốn thành phần đầu tiên trong ảnh nhiều thành phần được xây dựng lại. Người ta có thể tưởng tượng rằng ở một mức độ định dạng tập tin cao hơn, chúng ta có thể báo hiệu ý nghĩa của bốn thành phần đầu tiên và giai đoạn mà giải mã các thành phần này là tùy chọn. Những thông tin này sẽ cho phép bộ giải mã lựa chọn đại diện của các ảnh được mong muốn; toàn sắc, sai màu, hoặc đầy đủ đa phổ. Tuy nhiên, bao gồm các siêu dữ liệu để kích hoạt chức năng này nằm ngoài phạm vi của Tiêu chuẩn này.
Hình O.35 cho thấy một phần của biến đổi hướng ngược được gắn liền với biến đổi không tương quan dựa trên ma trận mà hoạt động trên một tập hợp con của bảy thành phần ảnh đa phổ ban đầu. Nếu nhìn vào các số của các thành phần trung gian, l1(i), chúng ta thấy rằng các thành phần biến đổi hướng ngược được lưu trữ trong vị trí ban đầu của chúng. Các thành phần trung gian được tạo ra bởi biến đổi không tương quan hướng ngược này thực sự là các thành phần ảnh được xây dựng lại, vì không gì trong số chúng sẽ được tiếp tục sửa đổi theo giai đoạn biến đổi tiếp theo. Các địa điểm của các thành phần này sẽ thay đổi, tuy nhiên, kể từ khi các thành phần bổ sung mà sẽ được tạo ra sẽ được đặt ở phía trước của chúng, về phía bên phải của hình O.35, các thông số tập hợp thành phần MCC được đưa ra cho biến đổi không tương quan đảo ngược. Để hoàn thành các đặc điểm kỹ thuật của biến đổi, các đoạn đánh dấu MCT phải có mặt trong phần chính hoặc phần đầu ô vuông đầu tiên thích hợp và chứa ma trận biến đổi tương quan và ma trận độ lệch không tương quan (xem A.3.7). Các chỉ số liên quan đến cả hai ma trận là một (Tmcci = 0 x 000101).
Hình O.35 – Ma trận biến đổi không tương quan (tập hợp thành phần MCC0 các chỉ số 0)
Hình O.36 cho thấy sự biến đổi phụ thuộc hướng ngược cho các thành phần dòng mã 5 và 3. Các biến đổi hướng ngược tạo ra các thành phần trung gian 5 và 3. Một lần nữa, các thành phần này thực sự tương ứng với các thành phần tái tạo ảnh 5 và 3 tương ứng. Việc biến đổi phụ thuộc hướng ngược đã được đặt vào tập hợp thành phần 1 trong đoạn đánh dấu MCC đầu tiên.
Hình O.36 – Biến đổi phụ thuộc (tập hợp thành phần MCC0 các chỉ số 0)
Tập hợp thành phần 2 cho đoạn đánh dấu MCC đầu tiên được đưa ra trong hình O.37. Tập hợp thành phần này không có bất kỳ biến đổi hướng ngược và chỉ bao gồm một thành phần duy nhất. Các thành phần chỉ đơn giản là đi qua. Điều này đạt được bằng cách xác định một ma trận biến đổi bằng 0 và một ma trân độ lệch bằng 0 trong trường Tmcc. (Biến đổi sẽ bằng 0 bất kể kiểu biến đổi trong trường Xmcc được thiết lập để biến đổi không tương quan hoặc một sự biến đổi phụ thuộc).
Tập hợp thành phần 2 chỉ số MCCo
Nmcc0 = 4
Cmcc00 = 6
Mmcc0 = 1
Wmic00 = 6
Tmic0 = 0x000101
Hình O.37 – Các yếu tố trung gian thông qua (tập hợp thành phần MCC0 các chỉ số 2)
Hình O.38 minh họa dòng chảy của các thành phần thông qua các giai đoạn biến đổi kết hợp với MCC0. Người ta có thể nghĩ rằng trong ảnh đa phổ bảy thành phần như ba tập hợp thành phần riêng biệt (một tập hợp không tương quan, một tập hợp phụ thuộc, và một tập hợp thông qua); từ một điểm nhìn cú pháp dòng mã, nó đã được xử lý với một giai đoạn biến đổi đơn yêu cầu ba biến đổi thành phần khác nhau. Đôi khi nó sẽ có thể có những lựa chọn khác nhau cho việc tổ chức các tập hợp thành phần trong một giai đoạn biến đổi. Quyết định này liên quan đến thành viên tập hợp thành phần có thể có những tác động vào kích thước của các ma trận biến đổi. Trong một số trường hợp, sử dụng một số lượng lớn các tập hợp thành phần nhỏ hơn có thể làm giảm chi phí ma trận biến đổi trong dòng mã.
Hình O.38 – Các tập hợp thành phần trong MCC0, xử lý biến đổi bước 0
Cho đến thời điểm này, chúng ta đã bỏ qua thực tế là bộ mã hóa sẽ bao gồm hướng dẫn cho bộ giải mã để tạo ra bốn thành phần ảnh tái tạo bổ sung. Đoạn đánh dấu MCC đầu tiên đã được sử dụng để tái tạo lại các thành phần ảnh ban đầu, nhưng chúng ta phải bao gồm một giai đoạn bổ sung để tạo ra các thành phần bổ sung. Phương trình O-8 cung cấp định dạng của thành phần toàn sắc bổ sung, , và ba thành phần sai màu bổ sung: , , và . Với định dạng của các thành phần bổ sung, chúng ta lại một lần nữa phải đối mặt với một sự lựa chọn về tập hợp thành phần và biến đổi. Chúng ta có thể tạo ra một tập hợp thành phần riêng biệt cho mỗi một phương trình, và do đó cung cấp một biến đổi dựa trên ma trận 3×3 và biến đổi dựa trên ma trận 1×3. Ngoài ra, chúng ta có thể tạo ra một tập hợp thành phần mà thực hiện một biến đổi dựa trên ma trận 4×4 bao gồm tất cả các thành phần bổ sung. Chúng ta chọn phương thức thứ hai.
Wi trong phương trình này đại diện cho các thành phần ảnh đầu vào ban đầu. Sau giai đoạn đầu tiên của biến đổi hướng ngược, những thành phần tương ứng với các thành phần trung gian, l1(i). Hình O.39 cho thấy cách các thành phần bổ sung được tạo ra trong một biến đổi không tương quan kết hợp với tập hợp thành phần không trong giai đoạn biến đổi thứ hai. R(i) trong hình đề cập đến các thành phần ảnh đầu ra từ quá trình biến đổi nhiều thành phần hướng ngược hoàn thành. (Các ký hiệu là để phân biệt chúng từ các thành phần ảnh ban đầu. Các thành phần ảnh ban đầu, Wi, sẽ là một tập hợp con của R(i).)
Hình O.39 – Ma trận biến đổi không tương quan (tập hợp thành phần MCC1 các chỉ số 0)
Hình O.40 hiển thị thông tin tập hợp thành phần cần thiết để đặt các thành phần ảnh ban đầu sau các thành phần được tạo ra thêm. Các thành phần không trải qua biến đổi (như được chỉ ra bởi biến đổi vô giá trị và chỉ số ma trận độ lệch), nhưng được hoán vị bởi số mũ trong trường Wmcc1j. Hình O.41 cho thấy dòng chảy của các thành phần thông qua các tập hợp thành phần MCC được kết hợp với giai đoạn thứ hai của quá trình biến đổi thành phần hướng ngược. Như đã đề cập trước đó, tất cả các ma trận chuyển đổi phải được bao gồm trong dòng mã trong các đoạn đánh dấu MCT với các chỉ số tương ứng với các tham chiếu trong các đánh dấu MCC tương ứng.
Tập hợp thành phần 1 các chỉ số MCC1
Nmcc1 = 7
Cmcc10 = 0, Cmcc11 = 1, Cmcc12 = 2 Cmcc13 = 3, Cmcc14 = 4, Cmcc15 = 5, Cmcc16 = 6 Mmcc1 = 4 Wmcc10 = 4 , Wmcc11 = 5, Wmcc12 = 6, Wmcc13 = 7 , Wmcc14 = 8, Wmcc15 = 9, Wmcc16 = 10 Tmcc1 = 0x000000 |
Hình O.40 – Tập hợp thành phần MCC1 1 (7 thành phần thông qua)
Hình O.41 – Các tập hợp thành phần trong MCC1, xử lý biến đổi bước 0
Cuối cùng, bộ mã hóa phải bao gồm một đoạn đánh dấu MCO xác định thứ tự của các bước biến đổi. Mỗi một trong trong số hai đoạn đánh dấu MCC đã được mô tả phải được gán một chỉ số. Như trong hình O.42, những chỉ số phải xuất hiện trong đoạn đánh dấu MCO theo thứ tự của ứng dụng giai đoạn biến đổi.
Các chỉ số MCO
Nmco = 2 Imcc0 = Chỉ số của MCC0 Imcc1 = Chỉ số của MCC1 |
Hình O.42 – Đoạn đánh dấu MCO cho biến đổi nhiều thành phần hướng ngược
Các hình O.35, O.36, O.37, O.39, O.40 và O.42 đại diện cho toàn bộ các ma trận biến đổi không tương quan hướng ngược, ma trận biến đổi phụ thuộc hướng ngược, các chỉ số đoạn đánh dấu MCC, và các chỉ số đoạn đánh dấu MCO cho mười một thành phần ảnh tái tạo trong ví dụ này.
Các sự chú ý sau đây có thể được thực hiện liên quan đến các tập hợp thành phần:
– Các chỉ số Wmcci xác định thứ tự cuối cùng của các thành phần ảnh được tái tạo.
– Wmcci có thể được sử dụng để tạo ra không gian cho các thành phần mới mà không tồn tại trong dòng mã. Các thành phần mới có thể tự được tạo ra bởi các quá trình biến đổi không tương quan và/hoặc phụ thuộc.
– Các thành phần đầu vào có thể được tái sử dụng trong các tập hợp thành phần khác nhau. Các thành phần đầu ra phải được lưu giữ riêng biệt trên tất cả các tập hợp thành phần trong bất kỳ đoạn đánh dấu MCC nhất định.
– Nếu một đoạn đánh dấu MCC tham chiếu một thành phần đầu vào hay đầu ra có giá trị chưa được ấn định, thành phần đó phải được coi là một thành phần không (tức là đầy đủ các số không).
– Thứ tự xử lý trong biến đổi phụ thuộc hướng ngược là rất quan trọng. Một bộ mã hóa được yêu cầu để định dạng các ma trận biến đổi phụ thuộc như các ma trận không phải là ma trận 0 bên dưới các ma trận đường chéo, cấu trúc này cho phép ma trận được áp dụng dòng theo dòng từ trên xuống dưới.
– Người ta có thể làm nhiều hơn không tương quan và dự đoán đơn giản với cú pháp đánh dấu biến đổi nhiều thành phần.
O.3.2 Thừa số biến đổi không tương quan đơn nhất và biến đổi không tương quan thuận nghịch
Như mô tả trong J.3.1.1.3, Tiêu chuẩn này hỗ trợ một biến đổi không tương quan thuận nghịch dựa trên ma trận nén nhiều thành phần. Trong các ứng dụng nhiều thành phần, đặc biệt là liên quan đến nhiều băng của dữ liệu đo bức xạ, nén không mất mát số lượng được ưa thích mạnh mẽ để nén tổn hao. Trong những trường hợp, một biến đổi không tương quan dấu chấm động không thể được dung thứ, vì nó tự nhiên bị lỗi làm tròn. Thuận nghịch đúng có thể thu được chỉ trong điều kiện nghiêm ngặt.
May mắn là, biến đổi đơn nhất tạo thành một tập hợp lớn của các biến đổi không tương quan thường gặp. Gần đây, một kỹ thuật đã được phát triển cho yếu tố bất kỳ ma trận biến đổi đơn nhất vào một loạt các ma trận hướng ngược cơ sở hàng đơn (SERMs). Các SERMs hoạt động liên tục trên dữ liệu, và ở mỗi giai đoạn thay đổi chính xác một trong những mẫu đầu vào. Đối với một biến đổi NxN, N+1 SERMs được sản xuất. Kết quả của việc biến đổi là một số nguyên xấp xỉ cho những gì nếu không sẽ là một kết quả dấu chấm động. Tuy nhiên, biến đổi có thể được đảo ngược chính xác chỉ đơn giản bằng cách đảo ngược thứ tự của các hoạt động SERM N+1.
Để minh họa cho quá trình nhân tử hóa, hãy xem xét một ảnh bao gồm ba thành phần. Ma trận tương quan của ba thành phần được phân tích để tạo thành một ma trận biến đổi Karhunen-Loeve. Theo ký hiệu của Hao, các ma trận biến đổi được cho bởi . Quá trình nhân tử được thực hiện theo hai bước. Đầu tiên, một phân giải LU sửa đổi của A được thực hiện. Trong bước này, ma trận A được tính vào A=LUS0D, nơi mà L là đường chéo thấp hơn với đơn vị chéo, U là đường chéo cao hơn với đơn vị chéo, D là đường chéo với mục đơn vị (ngoại trừ mục cuối cùng cũng có thể bằng -1 ), và S0 là một SERM làm thay đổi chỉ mục cuối cùng của một vect Hoặc đầu vào. Đối với ma trận A, các bước nhân tử hóa như sau.
Với ma trận L, U, và D trong sự nhân tử hóa trên, sản phẩm của chúng hiện nay giảm xuống còn đồng nhất thức thông qua một loạt các phép nhân thông thường. Mỗi phép nhân thông thường là một SERM. Từ những điều trên, sản phẩm . Sự nhân tử hóa diễn ra như sau.
Ba SERMs trong phần này của nhân tử hóa bây giờ có thể được thay thế cho LU để có được sự nhân tử hóa đầy đủ.
Cho một vectHoặc đầu vào tương ứng với các giá trị của ba thành phần ở một vị trí không gian nhất định, việc nhân tử hóa này có thể được sử dụng để sản xuất ra một số nguyên xấp xỉ cho biến đổi dấu chấm động. Ở mỗi giai đoạn của phép nhân, chỉ có một phần tử của vectHoặc kết quả được thay đổi. Nếu một quy tắc làm tròn số được áp dụng cho phần tử của vectHoặc trước khi giai đoạn tiếp theo được tính toán, sau đó đầu vào cho bất kỳ giai đoạn nhất định nào là giá trị số nguyên. Hơn nữa, các hoạt động có thể được đảo ngược chính xác bằng cách sử dụng các quy tắc làm tròn giống nhau và chỉ cần đảo ngược thứ tự cùa các giai đoạn. Ví dụ, nếu C = [S3W], sau đó W = []. Chú ý rằng hướng ngược của một SERM có thể dễ dàng hình thành bằng cách phủ định các mục ngoài đường chéo góc của nó. Ngoài ra, các mục có thể được rời đi như chúng đang trong sự biến đổi chuyển tiếp, nhưng đối với các hướng ngược tổng các đóng góp đường chéo góc được trừ, thay vì thêm vào, mục phải được thay đổi. Tiêu chuẩn này yêu cầu bộ giải mã trừ đi các đóng góp ngoài đường chéo góc. Vì vậy, trong việc hình thành thông tin ma trận dòng mã, bộ mã, hóa chỉ cần cung cấp SERMs theo thứ tự đúng đề xử lý hướng ngược.
Trong khi quá trình biến đổi này là về mặt lý thuyết hoàn toàn có thể đảo ngược, trong thực tế sự chính xác hữu hạn của số học dấu chấm động khi có thể gây ra một số để được làm tròn đến giá trị khác nhau trong những biến đổi về chuyển tiếp và đảo ngược. (Ví dụ, giả sử một số được tạo ra như 0.4999 trong quá trình biến đổi chuyển tiếp, nhưng do thứ tự của các hoạt động và quy tắc số học dấu chấm động của bộ giải mã, số được tạo ra là 0.50001 trong quá trình biến đổi đảo ngược). Để đảm bảo sự đảo ngược trên nền tảng, các mục SERM phải được lượng tử hóa. Vì vậy Tiêu chuẩn này cung cấp cho một thừa số tỉ lệ kết hợp với mỗi SERM. Thừa số tỉ lệ được truyền đạt thông qua các kiến thức về vị trí của các phần tử được thay đổi. Khái niệm thừa số tỉ lệ được minh họa dưới đây.
Theo khái niệm, các SERMs trong sự nhân tử hóa có thể được coi là được ‘chồng’ vào một ma trận không vuông. Các ma trận không còn đại diện cho một phép nhân ma trận theo nghĩa thông thường. Thay vào đó, nó được hiểu rằng ở mỗi giai đoạn, một phần tử của vect Hoặc đầu vào bị thay đổi. Trong ví dụ trên, bốn SERMs theo khái niệm có thể được thay thế bằng ma trận sau đây:
Một bộ mã hóa sử dụng ma trận này để giữ SERMs sẽ nhận ra rằng để thực hiện biến đổi không tương quan đảo ngược, hàng đầu tiên của biến đổi chỉ điều chỉnh giá trị của các mẫu đầu vào cuối cùng chỉ. Hàng thứ hai chỉ điều chỉnh mẫu đầu vào đầu tiên, hàng thứ ba chỉ điều chỉnh mẫu đầu vào thứ hai, vv. Đảo ngược thứ tự của các hoạt động cho bộ giải mã theo khái niệm tương ứng với đảo ngược thứ tự các hàng của ma trận này:
Đây là hình thức thực tế của ma trận được chờ đợi bởi bộ giải mã.
Tiếp theo, một thừa số tỉ lệ thích hợp phải được lựa chọn cho mỗi hàng. Thừa số tỉ lệ phải là một lũy thừa chính xác của 2. Giá trị của nó được xác định từ độ chính xác xấp xỉ mong muốn và độ sâu bit có sẵn. Trong ví dụ này, một thừa số tỉ lệ của 256 được chọn cho mỗi hàng của ma trận SERM. Ma trận SERM biến đổi chuyển tiếp lượng tử hóa kết quả được cho bởi:
Ma trận QSeff là tập hợp hiệu quả của các hệ số SERM sẽ được áp dụng bởi quá trình biến đổi có thể đảo ngược.
Ma trận biến đổi hướng ngược, vẫn được hình thành bằng cách đảo ngược các hàng của ma trận biến đổi chuyển tiếp:
Ma trận này phải được có trong dòng mã trong một đoạn đánh dấu MCT. Các mục trong ma trận xuất hiện theo thứ tự quét trong đoạn đánh dấu.
Với ma trận biến đổi chuyển tiếp lượng tử hóa bây giờ được xác định, việc biến đổi có thể đảo ngược có thể được áp dụng. Các phương trình chuyển đổi chuyển tiếp được đưa ra trong Phụ lục J, các phương trình J-7 đến J-10. Mỗi bước của việc biến đổi bao gồm:
1) tính toán một tổng giá trị của các mẫu mà không bị thay đổi ở các bước;
2) tỉ lệ tổng của thừa số tỉ lệ và một trong hai cách thêm hoặc trừ đi các mẫu bị thay đổi từ tổng đó; và
3) thay thế kết quả lấy mẫu bị thay đổi.
Thay thế này được thực hiện trước giai đoạn tiếp theo của sự biến đổi. Các mẫu đầu vào có thể hoán chuyển bằng và bù đắp trước việc tính toán của biến đổi.
Giả sử rằng ở một vị trí không gian cụ thể, ba mẫu thành phần được đưa ra bởi một vect Hoặc . Giả sử thêm rằng không có hiệu số phụ gia được sử dụng, ví dụ, oi = 0, i = 0, 1, 2, trong phương trình J-7. Trình tự sau đây cho thấy làm thế nào biến đổi được thực hiện từng bước.
Ma trận biến đổi dấu chấm động ban đầu sẽ cung cấp một kết quả của . Sự khác biệt nhỏ giữa sự biến đổi dấu chấm động đầy đủ và số nguyên xấp xỉ của nó nói chung sẽ tạo ra một số thay đổi trong hiệu suất nén. Tuy nhiên, không giống như phiên bản động, việc biến đổi số nguyên là hoàn toàn đảo ngược.
O.3.3 Biến đổi phụ thuộc, không thuận nghịch và thuận nghịch
Như mô tả trong J.3.1.2, Tiêu chuẩn này hỗ trợ một biến đổi phụ thuộc dựa trên ma trận nén nhiều thành phần. Trong một số ứng dụng nén nhiều thành phần, thành phần khác nhau đơn giản có thể loại bỏ thích đáng sự tương quan đầy đủ theo hướng thành phần. Trong những phần khác, nguồn dữ liệu có thể sản xuất mẫu theo thứ tự thành phần, do đó tạo ra một lợi thế cho biến đổi mà chỉ dựa trên các mẫu quan sát trước đó. Trong những trường hợp này, những hạn chế của việc biến đổi phụ thuộc dựa trên ma trận có thể được phù hợp tốt với mô hình xử lý. Việc biến đổi phụ thuộc có thể được thực hiện không hướng ngược hoặc hướng ngược . Trong mục này, một ví dụ về một biến đổi phụ thuộc không hướng ngược sẽ được trình bày. Các hệ số biến đổi tương tự sau đó sẽ được biến đổi để đáp ứng các hạn chế của việc biến đổi phụ thuộc hướng ngược và sẽ được áp dụng cho các dữ liệu ví dụ tương tự.
Trong ví dụ này, đầu vào sẽ bao gồm bốn thành phần ảnh. Nó được biết từ các đặc điểm nguồn mà bốn mẫu tại một vị trí không gian cụ thể tất cả sẽ là giá trị như nhau xấp xỉ. Giá trị đó, tuy nhiên, được biết đến là thay đổi từ vị trí không gian đến vị trí không gian. Do đó, mong muốn để gần đúng giá trị của thành phần thứ i bằng giá trị trung bình của các thành phần tử 0 đến i-1. Các phương trình dự đoán mong muốn được đưa ra dưới đây, giả định rằng các mẫu thành phần đầu vào được biểu diễn như Wi và các thành phần chuyển đổi được biểu diễn là Ci.
C0 = W0
C1 = W1 – W0
C2 = W2 – 0.5W0 – 0.5W1
C3 = – 0.333W0 – 0.333W1 – 0.333W2
So sánh các phương trình với J.3.1.2.2, phương trình J-13, quan sát thấy rằng oi = 0, i= 0, 1, 2, 3, và:
Những giá trị của Tij sử dụng trong phương trình J-13 là những phần có trong ma trận. (Đây là những giá trị ma trận biến đổi tương tự được yêu cầu để xuất hiện trong một đoạn đánh dấu MCT cho bộ giải mã.) Cho một mẫu đầu vào W = tại một vị trí không gian cụ thể, biến đổi phụ thuộc không hướng ngược chuyển tiếp được thực hiện theo các bước sau đây.
C0 =112
C1 =108 -1 . 112 = -4
C2 = 100 – 0.5 . 112 – 0.5 . 108 = – 10
C3 = 107 – 0.333 . 112 – 0.333 . 108 – 0.333 . 100 = – 0.333
Những mẫu biến đổi sau đó sẽ được qua tới biến đổi sóng con không gian. Giá trị của C3 sẽ được biến đổi sang một số nguyên trước biến đổi sóng con không gian. Trong trường hợp các biến đổi thành phần dựa trên ma trận không hướng ngược, không có quy tắc nào đã được quy định cho biến đổi này, mặc dù làm tròn hoặc rút gọn sẽ là sự lựa chọn điển hình.
Để mở rộng ví dụ, giả sử rằng nó là cần thiết để thực hiện một sự xấp xỉ cho biến đổi tương tự trong một kiểu cách hướng ngược. Để thực hiện điều này, một thừa số tỉ lệ được lựa chọn cho từng bước trong việc biến đổi. Các thừa số tỉ lệ phải là một lũy thừa của 2, và được lựa chọn dựa trên độ chính xác của dữ liệu và độ chính xác mong muốn của xấp xỉ. Không có thừa số tỉ lệ là cần thiết cho bước đầu tiên, kể từ khi bước này bản đồ đơn giản các thành phần đầu vào đầu tiên với thành phần đầu ra đầu tiên. Chỉ có một hệ số ma trận cần thiết trong bước thứ hai, việc tính toán của C1. Một thừa số tỉ lệ của 1 cung cấp một đại diện chính xác của t10. Trong bước thứ ba, hai hệ số ma trận là một lũy thừa của 2, cụ thể là 2–1. Do đó, thừa số tỉ lệ cho bước thứ hai có thể được chọn là 2. Trong bước cuối cùng, một thừa số tỉ lệ của 512 được chọn để đạt được một xấp xỉ đủ để các hệ số cần thiết. Ma trận chỉ số biến đổi lượng tử hóa, QT, được đưa ra dưới đây, nơi mà các thừa số tỉ lệ cho bước này cũng được bao gồm như là các mục chéo trong ma trận.
Khi áp dụng các bước liên quan đến biến đổi phụ thuộc hướng ngược (phương trình J-16 trong J.3.1.2.4), các hệ số lượng tử sẽ tương ứng với các hệ số biến đổi hiệu quả:
Biến đổi được thực hiện theo phương trình J-16 trong các bước tiếp theo.
C0 = 112
Nói chung, sẽ có sự khác biệt nhỏ giữa các giá trị biến đổi thu được từ biến đổi đảo ngược và giá trị làm tròn thu được từ việc triển khai không đảo ngược. Có thể có một số thay đổi trong hiệu suất nén kết hợp với những khác biệt này.
O.4 Nền tảng nâng cao lượng tử hóa
Các ứng dụng cảm biến từ xa yêu cầu sự thực hiện bộ nhớ thấp, lưu lượng cao của JPEG 2000 để sử dụng trên tàu vũ trụ và máy bay. Việc thực hiện này, được gọi là chế độ quét dựa trên, đã được chứng minh cho ITU-T Rec. T.800 | ISO/IEC 15444-1. Các ảnh được xử lý như các tập hợp của một số ít các dòng, được gọi là các phần tử quét. Trong các thử nghiệm của các chế độ quét dựa trên, nó đã được chứng minh rằng việc sử dụng các giới hạn chứ không phải là các ô vuông như các yếu tố quét cho chất lượng ảnh tốt hơn, bởi vì các ô vuông nhỏ có xu hướng tạo ra các sự giả tưởng biên.
Đối với nén tổn hao chất lượng cao, mong muốn để thêm các phương pháp lượng tử với chế độ quét dựa trên. Để duy trì lưu lượng cao, việc lượng tử hóa phải được thực hiện với điều khiển tốc độ không lặp lại.Tuy nhiên, điều khiển tốc độ không lặp lại trên ảnh như một toàn thể chỉ có thể đạt được nếu sự lượng tử mã hóa mắt cáo (hoặc sự lượng tử vô hướng rõ ràng) được thực hiện trên cơ sở khu vực theo khu vực, với các kích cỡ bước khác nhau cho mỗi giới hạn.
Để kích hoạt thủ tục này, cú pháp mới được sử dụng để báo hiệu các kích thước bước trên cơ sở khu vực theo khu vực. Kể từ khi một ảnh dài chia thành các giới hạn ngắn có thể chứa nhiều ô vuông, nó cũng là mong muốn để tăng giá trị tối đa của chỉ số phần ô vuông (hiện tại 254).
Thư mục tài liệu tham khảo
[1] ISO/IEC 15444-2 : 2004 – Information Technology – IPEG 2000 Image Coding System: Extensions.
[2] ISO/IEC 15444-2 : 2004/Technical CHoặcrigendum 3: 01/2005 : Information Technology – IPEG 2000 Image Coding System: Extensions.
[3] ISO/IEC 15444-2: 2004//Technical Corrigendum 4:05/2007: Information Technology – JPEG 2000 Image Coding System: Extensions.
[4] ITU-T Recommendation T.42 (1996), Continuous-tone colour representation method for facsimile.
[5] ISO/IEC 8859-1:1998, Information technology – 8-bit single-byte coded graphic character sets – Part 1: Latin alphabet No. 1.
[7] ISO 3166-1:1997, Codes for the representation of names of countries and their subdivisions – Part 1: Country codes.
[8] ISO 3166-2:1998, Codes for the representation of names of countries and their subdivisions – Part 2: Country subdivision code.
[9] ISO/IEC 11578:1996, Information technology – Open Systems Interconnection – Remote Procedure Call (RPC).
[10] ISO/IEC 646:1991, Information technology – ISO 7-bit coded character set forinformation interchange.
[11] ISO 5807:1985, Information processing – Documentation symbols and conventions for data, program andsystem flowcharts, program network charts and system resources charts.
[12] ISO/IEC 15938, MPEG-7.
[13] ISO 10126-2:1991, Banking – Procedures for message encipherment (wholesale) – Part 2: DEA algorithm.
[14] IEEE StVÀard 754-1985 R1990, IEEE Standard for Binary Floating-Point Arithmetic.
[15] IETF RFC 1321 (1992), The MD5 Message-Digest AlgHoặcithm..
[17] IETF RFC 2279 (1998), UTF-8, A transformation format of ISO 10646.
[18] IETF RFC 2630 (1999), Cryptographic Message Syntax.
[19] IETF RFC 2313 (1998), PKCS #1: RSA Encryption, Version 1.5.
[20] International ColHoặc ConsHoặctium, ICC profile format specnếuication. ICC.1.
[21] IEC 61966-2-1:1999, Multimedia systems and equipment – Colour measurement and management: Part 2-1: Colour management – Default RGB colour space – sRGB, plus its Amendment 1: 2003.
[22] Digital Imaging Group, Flashpix digital image file fHoặcmat. Version 1.0.1, 10 July 1997.
[23] PIMA 7666. Photography-Electronics still picture imaging-Reference Output Medium Metric RGB Color encoding: ROMM-RGB.
[24] PIMA 7667:2001. Photography-Electronics still picture imaging-Extended sRGB color encoding e-sRGB.
[25] Federal InfHoặcmation Processing standard Publication (FIPS PUB) 186-2, Digital Signature Standard (DSS). <http://www.itl.nist.gov/fipspubs/fip186-2.pdf>
[26] ANSI X9.30.2-1997, Public Key Cryptography for the Financial Services Industry – Part 2: The Secure Flash Algorithm (SHA-1). <http://www.itl.nist.gov/fipspubs/fip180-1.htm>
[27] W3C. Extensible Markup Language (XML 1.0), 2nd edition Rec-xml-2000106, <http://www.w3.org/TR/REC-xml>.
[28] W3C. Namespaces in XML, Rec-xml-names-19990114, <http://www.w3.org/TR/1999/REC-xml- names>.
[29] W3C. XML Schema Part 1: Structures, Rec-xmlschema-1-20010502, <http://www.w3.org/TR/ xmlschema-1>.
[30] W3C. XML Schema Part 2: Datatypes, Rec-xmlschema-2-20010502, <http://www.w3.org/TR/ xmlschema-2>.
TIÊU CHUẨN QUỐC GIA TCVN 11777-2:2018 (ISO/IEC 15444-2:2004 WITH AMENDMENT 2:2006, 3:2015, 4:2015) VỀ CÔNG NGHỆ THÔNG TIN – HỆ THỐNG MÃ HÓA ẢNH JPEG 2000 – PHẦN MỞ RỘNG | |||
Số, ký hiệu văn bản | TCVN11777-2:2018 | Ngày hiệu lực | |
Loại văn bản | Tiêu chuẩn Việt Nam | Ngày đăng công báo | |
Lĩnh vực | Ngày ban hành | ||
Cơ quan ban hành | Tình trạng | Còn hiệu lực |
Các văn bản liên kết
Văn bản được hướng dẫn | Văn bản hướng dẫn | ||
Văn bản được hợp nhất | Văn bản hợp nhất | ||
Văn bản bị sửa đổi, bổ sung | Văn bản sửa đổi, bổ sung | ||
Văn bản bị đính chính | Văn bản đính chính | ||
Văn bản bị thay thế | Văn bản thay thế | ||
Văn bản được dẫn chiếu | Văn bản căn cứ |