Tài liệu Luận văn Thiết kế headend SD, HD: Luận văn tốt nghiệp - 1 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Chương 1: Tổng quan về truyền hình và chuẩn MPEG
1. Lịch sử truyền hình
Truyền hình, hay còn được gọi là báo hình, là một loại phương tiện thông tin
đại chúng hiện đại, không thể thiếu của một quốc gia. Nó là một phương tiện hiệu
quả nhất trong truyền bá thông tin, phục vụ tốt nhiệm vụ chính trị, kinh tế, xã hội, …
của một địa phương hay một quốc gia, phát triển mạnh mẽ trên quy mô toàn cầu, là
loại thông tin đến được nhiều người nhất.
Truyền hình là loại hình báo chí truyền tải nội dung chủ yếu bằng hình ảnh
sống động và các phương tiện biểu đạt khác như lời nói, chữ viết, hình ảnh, âm
thanh, ... truyền hình chính là ngành công nghiệp được phát triển trên cơ sở các tiến
bộ về công nghệ, thiết bị thu, phát, truyền dẫn, trường quay.
1.1 Quá tr...
112 trang |
Chia sẻ: hunglv | Lượt xem: 1182 | Lượt tải: 2
Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Thiết kế headend SD, HD, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Luận văn tốt nghiệp - 1 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Chương 1: Tổng quan về truyền hình và chuẩn MPEG
1. Lịch sử truyền hình
Truyền hình, hay còn được gọi là báo hình, là một loại phương tiện thông tin
đại chúng hiện đại, không thể thiếu của một quốc gia. Nó là một phương tiện hiệu
quả nhất trong truyền bá thông tin, phục vụ tốt nhiệm vụ chính trị, kinh tế, xã hội, …
của một địa phương hay một quốc gia, phát triển mạnh mẽ trên quy mô toàn cầu, là
loại thông tin đến được nhiều người nhất.
Truyền hình là loại hình báo chí truyền tải nội dung chủ yếu bằng hình ảnh
sống động và các phương tiện biểu đạt khác như lời nói, chữ viết, hình ảnh, âm
thanh, ... truyền hình chính là ngành công nghiệp được phát triển trên cơ sở các tiến
bộ về công nghệ, thiết bị thu, phát, truyền dẫn, trường quay.
1.1 Quá trình phát triển của truyền hình
Truyền hình ra đời trong nửa đầu thế kỷ XX, sau khi có sự ra đời của tivi, các
thiết bị truyền dẫn, phát sóng và các tiến bộ về công nghệ. Sau nhiều tiến bộ khác
nhau, năm 1923, kỹ sư người Scotland, ông John Logie Baird đã đăng ký phát minh
ra chiếc máy có khả năng hiện hình ảnh nhận từ những tín hiệu điện từ mà sau này
chúng ta gọi là vô tuyến truyền hình (tivi).
Từ khoảng năm 1932, hãng BBC của Anh bắt đầu phát các chương trình
truyền hình thường kỳ. Ngày nay, sóng truyền hình có thể đạt tới mọi nơi trên trái
đất qua trạm chuyển tiếp, cáp truyền hình, vệ tinh nhân tạo và internet. Các
chương trình truyền hình, từ chỗ chỉ phát bản tin thô sơ, đã tiến bộ dần với việc cho
ra đời hàng trăm loại hình chương trình như các game show, truyền hình thực tế,
phỏng vấn truyền hình, truyền hình theo yêu cầu, ...
Nhờ sự phát triển của khoa học kỹ thuật, mà công nghệ truyền hình ngày càng
hoàn thiện về mặt kỹ thuật cũng như mặt sản xuất chương trình, từ lúc mới ra đời
chỉ là truyền hình analog đen trắng dần phát triển lên truyền hình màu, rồi truyền
hình số SDTV (truyền hình độ nét chuẩn) và HDTV (truyền hình độ nét cao).
1.2 Các thế hệ truyền hình
Từ lúc ra đời cho đến nay công nghệ truyền hình phát triển một cách vượt bậc
giữ một vị trí quan trọng trong các lĩnh vực như: giải trí, kinh doanh, chính trị, thông
tin, … có nhiều cách phân chia các thế hệ truyền hình, nếu dựa vào công nghệ phát
hình thì có thể chia ra hai công nghệ truyền hình đó là công nghệ số và analog. Còn
nếu dựa vào công nghệ sản xuất tivi thì ta có thể chia thành các loại như công nghệ
Luận văn tốt nghiệp - 2 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
CRT, công nghệ LCD, công nghệ Plasma, công nghệ OLED, … còn dựa vào màu sắc
của hình ảnh thì phân ra hai loại là truyền hình đen trắng và truyền hình màu, còn
dựa vào môi trường truyền thì chia làm hai loại là truyền hình vô tuyến và truyền
hình hữu tuyến. Ở đây chúng ta sẽ tìm hiểu kỹ hơn về hai loại công nghệ này.
1.2.1 Truyền hình vô tuyến
Truyền hình vô tuyến là công nghệ truyền hình được sử dụng rộng rãi từ lâu
và vẫn tồn tại cho đến ngày nay, với ưu điểm là có vùng phủ sóng rộng, có thể phủ
sóng một vùng lãnh thổ rộng lớn (tỉnh, thành phố, quốc gia, …) nhờ các trạm trung
chuyển. Nó sử dụng sóng điện từ RF để truyền tín hiệu truyền hình (hình ảnh, âm
thanh, …) từ đài phát đến máy thu (tivi) nhờ môi trường không khí.
Truyền hình vô tuyến được phân ra làm nhiều loại nhưng có hai loại quan
trọng nhất được sử dụng rộng rãi là truyền hình mặt đất và truyền hình vệ tinh.
Truyền hình vô tuyến chịu nhiều can nhiễu của môi trường và thời tiết như mưa,
sấm sét, các vật cản, …
a) Truyền hình mặt đất
Truyền hình mặt đất được sử dụng để phát sóng trên một vùng lãnh thổ tương
đối rộng lớn (một tỉnh, thành phố, một khu vực, một quốc gia), lợi dụng sự phản xạ
của tầng điện li đối với sóng RF băng tần VHF và UHF để truyền hính hiệu đi xa.
Máy thu (tivi) thu tín hiệu từ các đài phát hay từ các trạm thu phát trung gian nhờ
anten thu (chủ yếu là anten yagi).
Tần số phát của truyền hình mặt đất chủ yếu sử dụng băng tần VHF có dải tần từ
30 MHz ÷ 300 MHz và băng tần UHF có dải tần từ 300 MHz ÷ 1000 MHz
Tín hiệu được điều chế bằng phương pháp điều chế của truyền hình vệ tinh
COFDM nhưng phát xuống mặt đất.
b) Truyền hình vệ tinh
Truyền hình vệ tinh được sử dụng để phát sóng trên vùng lãnh thổ rất rộng lớn
(một quốc gia, một châu lục, toàn cầu), lợi dụng sự truyền thẳng của tần số siêu cao
tần qua tầng khí quyển để truyền tín hiệu từ mặt đất đến vệ tinh và từ vệ tinh xuống
mặt đất sử dụng mode truyền bất đồng bộ (ATM-Asynchronous Transfer Mode).
Máy thu (tivi) thu tín hiệu truyền hình trực tiếp từ vệ tinh thông qua anten
parabol, tần số thu phát của truyền hình vệ tinh chủ yếu sử dụng băng C có dải tần
từ 3 GHz – 4 GHz và băng Ku có dải tần từ 10 GHz – 12 GHz.
Tín hiệu được điều chế bằng phương pháp điều chế COFDM.
Luận văn tốt nghiệp - 3 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
1.2.2 Truyền hình hữu tuyến
Khác với truyền hình vô tuyến, truyền hình hữu tuyến chủ yếu sử dụng dây
cáp để đưa tín hiệu từ đài phát đến máy thu (tivi). Cáp được sử dụng ở đây là cáp
quang và cáp đồng trục.
Do tín hiệu được truyền trực tiếp từ đài phát đến máy thu thông qua dây cáp
nên tín hiệu ít bị ảnh hưởng bởi môi trường bên ngoài. Vì thế tín hiệu thu được
tương đối tốt, chất lượng tương đối cao.
Tín hiệu số truyền trong cáp chủ yếu sử dụng các mode điều chế QAM (như:
16-QAM, 32-QAM, 64-QAM, 128-QAM, 256-QAM). Sử dụng mode càng cao thì
truyền được nhiều chương trình nhưng dễ ảnh hưởng bởi nhiễu.
2. Quá trình hình thành và phát triển truyền hình cáp Việt Nam
2.1 Quá trình hình thành
Với sự phát triển về kinh tế xã hội làm cho cuộc sống người dân đang ngày
càng cải thiện và tăng cao. Nhu cầu thụ hưởng các dịch vụ cao cấp cũng tăng theo.
Trong đó có nhu cầu về truyền hình – “món ăn tinh thần” không thể thiếu của mọi
người dân. Từ cách thức xem truyền hình thụ động, người dân muốn mình chủ động
hơn về chương trình truyền hình. Đứng trước những nhu cầu đó truyền hình tương tác
ra đời mà đi tiên phong là lĩnh vực truyền hình cáp.
Dịch vụ truyền hình cáp ra đời phục vụ nhu cầu thông tin giải trí ngày càng
tăng cao của người dân, mà lĩnh vực truyền hình thông thường không đáp ứng được
(như số lượng kênh nhiều, có kênh nước ngoài, có kênh chuyên biệt, không có
quảng cáo, chất lượng chương trình tốt, ổn định, …). Dịch vụ truyền hình cáp Việt
Nam hình thành từ những năm cuối của thập niên 90 và phát triển mạnh mẽ vào
các năm gần đây. Đặc biệt là ở hai thành phố lớn là Hồ Chí Minh và Hà Nội, như
trung tâm Dịch vụ Truyền hình cáp của đài Truyền hình Việt Nam VCTV ra đời
vào năm 1996 trên cơ sở của trung tâm dịch vụ truyền hình MMDS, hay trung tâm
Truyền hình cáp của đài Truyền hình thành phố Hồ Chí Minh HTVC ra đời năm
2003. Từ lúc ra đời truyền hình cáp sử dụng công nghệ analog hiện nay đang dần
chuyển sang số và sắp tới là phát chương trình HD.
2.2 Các nhà cung cấp dịch vụ truyền hình cáp hiện nay
Hiện nay, ở Việt Nam dịch vụ truyền hình cáp phục vụ chủ yếu ở Hà Nội và
thành phố Hồ Chí Minh và càng ngày được mở rộng ra các vùng lân cận chủ yếu là
khu vực đô thị, dân cư đông đúc. Có ba nhà cung cấp dịch vụ truyền hình cáp chính:
Luận văn tốt nghiệp - 4 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Trung tâm Dịch vụ Truyền hình cáp của đài Truyền hình thành phố Hồ Chí
Minh HTVC, hiện phát khoảng 67 kênh truyền hình trong và ngoài nước.
Trung tâm Dịch vụ Truyền hình cáp của đài Truyền hình Việt Nam VCTV,
hiện nay phát khoảng 54 kênh truyền hình trong và ngoài nước.
Công ty Truyền hình cáp SaigonTourist SCTV là doanh nghiệp nhà nước
liên doanh giữa đài Truyền hình Việt Nam và tổng công ty Du lịch Sài Gòn, hiện
nay phát khoảng 72 kênh truyền hình trong và ngoài nước.
Dịch vụ truyền hình cáp từ lúc ra đời cho đến nay đã có những bước phát triển
không ngừng. Với ưu thế của mình truyền hình cáp sẽ cạnh tranh quyết liệt với các
loại truyền hình khác để mở rộng và phát triển thị phần.
2.3 Lợi ích của dịch vụ truyền hình cáp
Dịch vụ truyền hình cáp ra đời mang lại bước đột phá mới trong công nghệ
truyền hình, làm thay đổi quan niệm về lĩnh vực truyền hình (truyền hình bây giờ
không còn là truyền hình miễn phí mà là truyền hình có thu phí). Truyền hình không
đơn thuần là giải trí, xem tin tức như thông thường nữa mà nó còn tích hợp nhiều tính
năng khác nữa như: VoD -Video on Deman-truyền hình theo yêu cầu, internet, mua
sắm qua mạng, … với chất lượng cực tốt với hai công nghệ là SDTV và HDTV.
Dịch vụ truyền hình cáp ra đời giúp chúng ta không còn thấy cảnh trên các
mái nhà chứa đầy các anten vừa tốn kém vừa mất mỹ quan và có thể xảy ra nguy
hiểm khi gãy ngã anten vào mùa mưa bão.
Vừa qua Thủ tướng Chính phủ ra quyết định số 22/2009/QĐ-TTg bắt buộc các
nhà cung cấp dịch vụ truyền hình cáp đến năm 2015 phải ngầm hoá tất cả các cáp
truyền hình của mình, tạo nên mỹ quan cho đô thị và an toàn cho người dân.
Dịch truyền hình cáp ra đời năng chất lượng truyền hình lên tầm cao mới. Chất
lượng dịch vụ gần như hoàn hảo phục vụ tốt nhiệm vụ chính trị của nhà nước, nhu cầu
quảng cáo của doanh nghiệp cũng như nhu cầu giải trí của người dân. Số lượng kênh
nhiều, nội dung phong phú, đa dạng, …
Dịch vụ truyền hình cáp ra đời đang thành công rực rỡ. Hứa hẹn sẽ tạo ra cuộc
chạy đua mới trong công nghệ truyền hình, khiến các nhà cung cấp dịch vụ truyền
hình đầu tư, nghiên cứu, khai thác các công nghệ mới như truyền hình di động,
IPTV, … tạo ra bước đột phá trong công nghệ truyền hình, tạo nên sự đa dạng về
dịch vụ phục vụ thị hiếu ngày càng cao của người dân. Giúp nâng cao đời sống văn
hóa, tinh thần cho xã hội.
Luận văn tốt nghiệp - 5 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
3. Giới thiệu về chuẩn MPEG
3.1 Khái quát về các tiêu chuẩn nén
Các tổ chức quốc tế đã•tiêu tốn hàng triệu USD để phát triển các tiêu chuẩn
nén. Như vậy, có thể thấy các tiêu chuẩn nén là cần thiết. Hiểu một cách đơn giản,
tiêu chuẩn nén cũng như ngôn ngữ chính thống của một đất nước. Quốc gia đó có
nhiều dân tộc với nhiều ngôn ngữ khác nhau, nhưng để thuận lợi cho giao tiếp cần có
một ngôn ngữ chính thống trên toàn lãnh thổ. Như vậy, chìa khoá ở đây là “sự dễ
dàng trong giao tiếp”. Chúng ta cần các tiêu chuẩn nén để thuận tiện trao đổi giữa
các hệ thống khác nhau.
Vậy tại sao cần có nhiều tiêu chuẩn nén? Bởi vì chúng ta có nhiều ứng dụng
nên đòi hỏi nhiều tiêu chuẩn khác nhau. Không có bất kỳ một tiêu chuẩn nén nào
có thể đáp ứng được tất cả các yêu cầu ứng dụng khác nhau. Các tiêu chuẩn nén
gồm hai mức: mức quốc gia và mức quốc tế.
Ở mức quốc gia: Có ANSI (American National Standard Institute), AIIM
(Association of Image and Information), tại Canada có tổ chức tiêu chuẩn của
Canada (Canadian Standards Association and the Standards Council of Canada).
Ở mức quốc tế: Có ISO (International Standards Organization), IEC (Interna-
tional Electrotechnical Commission), ITU (International Telecommunication Union,
CCITT) và một số tổ chức khác.
Các tiêu chuẩn nén với ứng dụng của chúng được khái quát trong bảng sau đây:
Chuẩn Phạm vi ứng dụng
CCITT T.4
CCITT T.6
JPEG
JBIG
CCITT H.261
MPEG - 1
MPEG - 2
MPEG - 4
Fax, ảnh dữ liệu.
Fax, ảnh dữ liệu.
Ảnh.
Fax, ảnh dữ liệu.
Điện thoại hình.
Ảnh, lưu trữ dữ liệu số (DSM).
Ảnh, HDTV, DSM.
Truyền thanh thông thường, quảng bá, cảm nhận từ xa.
Bảng 1.1: Các tiêu chuẩn nén với các ứng dụng của nó
Trong số đó, được sử dụng phổ biến và có phạm vi ứng dụng rộng rãi là
MPEG (Moving Pictures Experts Group). MPEG là một chuỗi các chuẩn bao gồm:
MPEG-1, MPEG-2 và MPEG-4. Trong đó MPEG-1 là cơ bản. MPEG-2 và MPEG-4
là sự phát triển và mở rộng từ MPEG-1.
Luận văn tốt nghiệp - 6 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Hiệp hội Viễn thông Quốc tế (ITU) và tổ chức Tiêu chuẩn Quốc tế/Uỷ ban Kỹ
thuật Điện tử Quốc tế (ISO/IEC) là hai tổ chức phát triển các tiêu chuẩn mã hoá
video. Theo ITU, các tiêu chuẩn mã hoá video được coi là các khuyến nghị gọi tắt
là chuẩn H.26x (H.261, H.262, và H.264). Với tiêu chuẩn ISO/IEC, chúng được gọi
là MPEG-x (như MPEG-1, MPEG-2 và MPEG-4).
3.2 Chuẩn MPEG-2
MPEG-2 là một tiêu chuẩn được sử dụng rộng rãi trong kỹ thuật truyền hình số và
kỹ thuật video số. MPEG-2 chia dòng tín hiệu thành hai loại là dòng truyền tải (TS-
Transport Stream) và dòng chương trình (PS- Program Stream). MPEG-2 là tiêu chuẩn
chung cho việc mã hoá audio và video.
MPEG-2 ra đời khắc phục những thiếu sót trong MPEG-1 như: hệ thống nén âm
thanh có hiệu quả kém, thiếu tính linh hoạt (có thể chấp nhận được ít hơn các biến
thể của loại gói) không hỗ trợ cách quét xen kẻ. MPEG-2 nén tín hiệu video và
audio với một dải tốc độ bit từ 1,5 Mbps tới 60 Mbps. Tiêu chuẩn này còn được gọi là
chuẩn quốc tế ISO/IEC 13818, là chuẩn nén ảnh động và âm thanh. Nó cung cấp một
dải các ứng dụng như: lưu trữ dữ liệu số, truyền hình quảng bá và truyền thông.
3.2.1 Các phần của MPEG-2
Phần 1 - Hệ thống: Mô tả cách đồng bộ, ghép kênh video và audio. Còn được
gọi là ITU-T Rec. H.222.0.
Phần 2 – Video: Mã hóa, nén tín hiệu video (xen kẻ và liên tục). Còn được
gọi là ITU-T Rec. H.262.
Phần 3 – audio: Nén, mã hóa các tín hiệu audio. Đa kênh–là phần mở rộng
của MPEG-1 audio.
Phần 4 : Mô tả các thủ tục để thử nghiệm sự phù hợp.
Phần 5 : Mô tả cho các hệ thống phần mềm mô phỏng.
Phần 6 : Mở rộng cho các mô tả DSM-CC (lưu trữ kỹ thuật số và kiểm soát).
Phần 7 : Advanced Audio Coding (AAC).
Phần 8 : Phần mở rộng video 10 bit. Ứng dụng chính là phòng thu video. Phần
8 đã được thu hồi vì thiếu quan tâm bởi tính công nghiệp.
Phần 9 : Gia hạn thời gian thực cho các giao diện.
Phần 10 : Phù hợp phần mở rộng cho DSM-CC.
Phần 11 : Quản lý sở hữu trí tuệ (IPMP).
Luận văn tốt nghiệp - 7 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
3.2.2 Profiles và Levels
MPEG - 2 video hỗ trợ rất nhiều ứng dụng từ thiết bị di động để hiệu chỉnh chất
lượng cao. Việc định chuẩn cho nhiều ứng dụng khó thực hiện và quá tốn kém. Vì vậy
MPEG-2 hỗ trợ các ứng dụng khác nhau thông qua định nghĩa Profiles và Levels.
Profiles xác định nhóm các tính năng như các thuật toán nén, định dạng lấy
mẫu tín hiệu màu thành phần, … Levels xác định về định lượng của: tốc độ bit cực
đại, kích thước frame tối đa, …
Các bảng dưới đây tóm tắt những quy định về các Profiles và Levels.
MPEG-2 Levels
Ký
hiệu Tên
Tốc độ
frame
(Hz)
Độ phân
giải hàng
tối đa
Độ phân
giải cột
tối đa
Số mẫu của tín hiệu
chói cực đại (=độ
rộng x chiều ngang
x tốc độ frame)
Vmax
trong
MP
(Mbps)
LL
Low
Level
23,976;
24; 25;
29,97; 30
352 288 3.041.280 4
ML
Main
Level
23,976;
24; 25;
29,97; 30
720 576
10,368,000, ngoại
trừ High profile,
14.475.600 của 4:2:0
và 11.059.200 của
4:2:2
15
H-14
High
1440
23,976;
24; 25;
29,97; 30;
50; 59,94;
60
1440 1152
47,001,600, ngoại
trừ trong High
profile với 4:2:0 là
62.668.800
60
HL
High
Level
23,976;
24; 25;
29,97; 30;
50; 59,94;
60
1920 1152
62,668,800, ngoài
trừ trong High
profile với 4:2:0,
83.558.400
80
Bảng 1.2: Các level
Luận văn tốt nghiệp - 8 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
MPEG-2 Profiles
Ký hiệu Tên
Kiểu mã
hóa
Tỉ lệ lấy
mẫu
Tỉ lệ khuôn
hình Modes scalable
SP Simple profile I, P 4:2:0
4:3, hay
16:9
none
MP Main profile I, P, B 4:2:0
4:3, hay
16:9
none
SNR
SNR Scalable
profile
I, P, B 4:2:0 4:3, hay
16:9
SNR (signal-to-
noise ratio)
Spatial
Spatially
Scalable
profile
I, P, B 4:2:0 4:3,
hay16:9
SNR
HP High profile I, P, B
4:2:2 hay
4:2:0
4:3, hay
16:9
SNR- or spatial-
scalable
Bảng 1.3: Các profile
3.2.3 Các ứng dụng của MPEG-2
a) DVD
Các đĩa DVD sử dụng các tiêu chuẩn MPEG-2/video, phải tuân theo một số
quy định sau:
•Các độ phân giải:
+ 720 × 480, 704 × 480, 352 × 480, 352 × 240 pixel (NTSC).
+ 720 × 576, 704 × 576, 352 × 576, 352 × 288 pixel (PAL).
•Tỉ lệ khuông hình:
+ 4:3.
+ 16:9.
Tốc độ frame:
+ 29,97 frame/s (NTSC).
+ 25 frame/s (PAL).
•Tốc độ bit của audio, video:
+ Video đỉnh 9,8 Mbps.
Luận văn tốt nghiệp - 9 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
+ Tổng số đỉnh 10,08 Mbps.
+ Tối thiểu 300 Kbps.
•YUV: 4:2:0.
Hộ trợ các phụ đề.
Audio:
+ Linear Pulse Code Modulation (LPCM): 48 KHz hay 96 KHz; 16 - bit hoặc
24-bit; lên đến sáu kênh (không phải tất cả các kênh có thể ghép được với nhau,
mà còn phụ thuộc vào tốc độ bit).
+ MPEG Layer 2 (MP2): 48 KHz, lên tới 5.1 kênh (bất buộc cho riêng hệ PAL).
+ Dolby Digital (DD, còn được gọi là AC-3): 48 KHz, 32 - 448 Kbps, lên tới 5,1 kênh.
+ DTS-Digital Theater Systems (hệ thống nhà hát số): 754 Kbps hoặc 1510
Kbps (không bắt buộc đối với đầu DVD).
+ NTSC DVD phải chứa ít nhất một LPCM hoặc Dolby Digital âm thanh theo dõi.
+ PTZ DVD phải chứa ít nhất một lớp 2 MPEG, LPCM, hoặc theo dõi các
âm thanh Dolby Digital.
GOP (Group of Pictures):
+ Header sequence phải được trình bày tại đầu của mỗi nhóm.
+ Giá trị lớn nhất của frame/GOP: 18 (NTSC), 15 (PAL) tức là 0,6 giây cả hai.
b) Chuẩn DVB
Ứng dụng cụ thể các quy định của MPEG-2 video trong tiêu chuẩn DVB:
Tiêu chuẩn SDTV:
+ 720, 640, 544, 480 hoặc 352×480 pixel, 24/1,001, 24, 30/1,001 hay 30 khung/s.
+ 352 × 240 pixel, 24/1,001, 24, 30/1,001 hay 30 khung/s.
+ 720, 704, 544, 480 hoặc 352 × 576 pixel, 25 khung/s.
+ 352 × 288 pixel, 25 khung/s.
Tiêu chuẩn HDTV:
+ 720 x 576 x 50 khung/s quét liên tục (576p50).
+ 1280 x 720 x 25 hoặc 50 khung/s quét liên tục (720p50).
+ 1440 hay 1920 x 1080 x 25 khung/s quét liên tục (1080p25).
+ 1440 hay 1920 x 1080 x 25 khung/s quét xen kẽ (1080i25).
+ 1920 x 1080 x 50 khung/s quét liên tục (1080p50).
Luận văn tốt nghiệp - 10 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
c) Chuẩn ATSC và ISDB-T
Các tiêu chuẩn ATSC A/53, được sử dụng tại Mỹ, sử dụng MPEG-2 video
MP@ HL, với các quy định như sau:
Tốc độ tối đa của dòng video MPEG-2 là 19,4 Mbps cho phát sóng truyền
hình, và 38,8 Mbps cho các chế độ “high-data-rate” (ví dụ như: truyền hình cáp).
Số lượng dòng đệm MPEG-2 được yêu cầu ở phía giải mã phải nhỏ hơn hoặc
bằng 999.424 byte.
Các dòng phải bao gồm các phép đo thông tin (đường cong gamma, sử dụng
các giá trị màu RGB, và các mối quan hệ giữa RGB và YCBCR).
Video được lấy mẫu 4:2:0 (màu thành bằng 1/2 của luma ngang và bằng 1/2
của luma dọc).
Độ phân giải, tỷ lệ khuông hình, và tốc độ frame/ field của video:
1920 × 1080 pixel (16:9), tại 30p, 29,97p, 24p, 23,98p, 30i, hoặc 29,97i.
1280 × 720 pixel (16:9), tại 60p, 59,94p, 30p, 29,97p, 24p, hoặc 23,98p.
704 × 480 pixel (hoặc 4:3 hoặc 16:9), tại 60p, 59,94p, 30p, 29,97p, 24p,
23,98p, 30i, hoặc 29.97i.
640 ×480 pixel (4:3), tại 60p, 59,94p, 30p, 29,97p, 24p, 23,98p, 30i, hoặc 29,97i.
3.3 Tiêu chuẩn MPEG-4
3.3.1 Khái quát về MPEG-4
Kể từ khi mới xuất hiện vào đầu những năm 90, chuẩn MPEG-2 đã hoàn toàn
thống lĩnh thế giới truyền thông. Cũng trong thập kỷ này, chuẩn nén MPEG-2 đã
được cải tiến về nhiều mặt. Giờ đây nó có tốc độ bit thấp hơn và việc ứng dụng nó
được mở rộng hơn nhờ có các kỹ thuật như đoán chuyển động, tiền xử lý, xử lý đối
ngẫu và phân bổ tốc độ bit tùy theo tình huống thông qua ghép kênh.
Tuy nhiên, chuẩn nén MPEG-2 cũng không thể được phát triển một cách vô
hạn định. Thực tế hiện nay cho thấy chuẩn nén này đã đạt đến hết giới hạn ứng
dụng của mình trong lĩnh vực truyền hình và lưu trữ video số. Bên cạnh đó, nhu cầu
nén video lại đang ngày một tăng cao kèm theo sự phát triển mạnh mẽ của mạng
IP mà tiêu biểu là mạng internet và công nghệ truyền hình HDTV. Khối lượng nội
dung mà các công ty truyền thông cũng như các nhà cung cấp dịch vụ thông tin
ngày càng lớn, ngoài ra họ còn có thể cung cấp nhiều dịch vụ theo yêu cầu thông
qua hệ thống cáp, vệ tinh và các hạ tầng viễn thông đặc biệt là mạng internet.
Các tiêu chuẩn mã hoá video ra đời và phát triển với mục tiêu cung cấp các
phương tiện cần thiết để tạo ra sự thống nhất giữa các hệ thống được thiết kế bởi
Luận văn tốt nghiệp - 11 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
những nhà sản xuất khác nhau đối với mọi loại ứng dụng video; Nhờ vậy thị trường
video có điều kiện tăng trưởng mạnh. Chính vì lý do này nên những người sử dụng
bộ giải mã cần có một chuẩn nén mới để đi tiếp chặng đường mà MPEG-2 đã bỏ
dở. Và MPEG-4 đã ra đời.
MPEG-4 là một tập hợp các phương pháp nén audio, video (AV) và dữ liệu kỹ
thuật số. Nó đã được giới thiệu vào cuối 1998 và còn có tên gọi khác là tiêu chuẩn
ISO/IEC 14496, hay H.264. Sử dụng nén AV, dữ liệu cho trang web và lưu trữ đĩa
CD, voice (điện thoại, videophone) và phát sóng truyền hình. MPEG-4 hấp thụ rất
nhiều các tính năng của MPEG-1 và MPEG-2 và các tiêu chuẩn khác có liên quan,
bổ sung các tính năng mới (mở rộng) như VRML hỗ trợ cho biểu diễn 3D, đa hợp
hướng đối tượng (bao gồm cả audio, video và các đối tượng VRML).
Ban đầu, mục tiêu chủ yếu MPEG-4 là truyền video với tốc độ bit thấp, tuy
nhiên sau đó phạm vi của nó đã được mở rộng hơn nữa của một tiêu chuẩn mã hóa
đa phương tiện MPEG-4 sử dụng hiệu quả trên nhiều loại tốc độ bit khác nhau, từ
một vài Kbps đến hàng chục Mbps. MPEG-4 cung cấp những chức năng sau đây:
Cải thiện hiệu quả mã hóa.
Khả năng mã hóa nhiều loại dữ liệu (video, âm thanh, lời nói).
Khả năng sữa lỗi cho phép truyền tốt hơn.
Khả năng tương tác với các thiết bị nghe nhìn ở phía thu.
3.3.2 Các phần trong MPEG-4
MPEG-4 bao gồm nhiều phần, mỗi phần có nhiều “Profiles” và “levels”
Phần Tên
khác
Kiểu Mô tả
Phần 1 ISO/IEC
14496-1
Systems Mô tả đồng bộ hóa và ghép kênh
video và audio.
Phần 2 ISO/IEC
14496-2
Visual Nén mã hóa dữ liệu hình ảnh
Phần 3 ISO/IEC
14496-3
Audio Nén và mã hóa audio
Phần 4 ISO/IEC
14496-4
Conformance
Mô tả các thủ tục để thử nghiệm
sự phù hợp các phần khác của
tiêu chuẩn.
Phần 5 ISO/IEC Reference Software Cung cấp phần mềm để chứng
Luận văn tốt nghiệp - 12 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
14496-5 minh và làm rõ các phần khác
của tiêu chuẩn.
Phần 6 ISO/IEC
14496-6
Delivery Multimedia
Integration
Framework (DMIF).
Phần 7 ISO/IEC 14496-7
Optimized
Reference Software
Cung cấp các ví dụ về việc làm
thế nào để triển khai thực hiện
các cải tiến
Phần 8 ISO/IEC
14496-8
Carriage on IP
networks
Xác định một phương pháp mang
nội dung MPEG-4 trên mạng IP.
Phần 9 ISO/IEC 14496-9 Reference Hardware
Cung cấp thiết kế phần cứng
dành cho chứng minh làm thế nào
để thực hiện các phần khác của
tiêu chuẩn.
Phần 10 ISO/IEC
14496-10
Advanced Video
Coding (AVC)
Mã hóa tín hiệu video
Phần 11 ISO/IEC 14496-11
Scene description
and Application
engine("BIFS")
Có thể được sử dụng cho nhiều
nội dung tương tác với nhiều
profiles, bao gồm cả các phiên
bản 2D và 3D.
Phần 12 ISO/IEC
14496-12
ISO Base Media File
Format
Định dạng tập tin cho các phương
tiện lưu trữ.
Phần 13 ISO/IEC 14496-13
Intellectual Property
Management and
Protection (IPMP)
Extensions.
Phần 14 ISO/IEC
14496-14
MPEG-4 File Format
Các thiết kế để chứa nội dung tập
tin định dạng MPEG-4, mà là dựa
trên Phần 12.
Phần 15 ISO/IEC
14496-15
AVC File Format Để lưu trữ video của phần 10 dựa
trên Phần 12.
Phần 16 ISO/IEC
14496-16
Animation
Framework
eXtension (AFX).
Chưa hoàn thành
Phần 17 ISO/IEC Timed Text subtitle Chưa được hoàn thành
Luận văn tốt nghiệp - 13 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
14496-17 format.
Phần 18 ISO/IEC
14496-18
Font Compression
and Streaming (for
OpenType fonts).
Chưa được hoàn thành
Phần 19 ISO/IEC
14496-19
Synthesized Texture
Stream.
Chưa hoàn thành
Phần 20 ISO/IEC 14496-20
Lightweight
Application Scene
Representation
(LASeR).
Chưa được hoàn thành
Phần 21 ISO/IEC
14496-21
MPEG-J Graphical
Framework Xtension
(GFX)
Chưa được hoàn thành
Phần 22 ISO/IEC
14496-22
Open Font Format
Specification (OFFS)
based on OpenType
Chưa được hoàn thành
Phần 23 ISO/IEC
14496-23
Symbolic Music
Representation
(SMR)
Chưa được hoàn thành
Bảng 1.4: Các phần của MPEG-4
Trong các phần của MPEG-4 có phần 10 là tương đối quan trọng vì nó quy
định các cách thức nén video, sau đây ta tìm hiểu về phần này.
3.3.3 Tìm hiểu về MPEG-4 phần 10
a) Giới thiệu chung
Những khuyến nghị của ITU được thiết kế dành cho các ứng dụng video
truyền thông thời gian thực như truyền hình hội nghị hay videophone. Mặt khác,
những tiêu chuẩn MPEG được thiết kế hướng tới mục tiêu lưu trữ video chẳng hạn
như trên đĩa quang DVD, quảng bá video số trên mạng cáp, đường truyền số DSL,
truyền hình vệ tinh hay những ứng dụng truyền dòng video trên mạng internet hoặc
thông qua mạng không dây (wireless).
Với đối tượng để truyền dẫn video HD thì ứng cử viên hàng đầu là chuẩn nén
MPEG-4 AVC, còn được gọi là H.264, MPEG-4 phần 10, H.26L hoặc JVT.
b) Các Profile và lelves của H.264 (MPEG-4 AVC)
Luận văn tốt nghiệp - 14 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Profile có nhiều phần để phù hợp với các ứng dụng khác nhau:
+ Constrained Baseline Profile (CBP): Được sử dụng chủ yếu trong các
ứng dụng thấp. Profile này được sử dụng rộng rãi trong các ứng dụng di động và
truyền hình hội nghị. Nó tương ứng với các tính năng của các nhóm Baseline, Main,
và High Profiles.
+ Baseline Profile (BP): Chủ yếu cho các ứng dụng giá rẻ với tài nguyên
điện toán hạn chế, Profile này sẽ được sử dụng rộng rãi trong các ứng dụng di động
và truyền hình hội nghị.
+ Main Profile (MP): Ban đầu nó được sử dụng cho truyền hình quảng bá.
Profile này thật sự phai nhạt trước sự xuất hiện của High profile.
+ Extended Profile (XP): Profile này định dạng dòng video, và khả năng
nén tương đối cao và bổ sung một số các thủ thuật bảo vệ chống mất dữ liệu và
chuyển mạch luồng máy chủ.
+ High Profile (HiP): Profile này ứng dụng chính cho truyền hình quảng bá
đặc biệt là các ứng dụng HDTV và việc lưu trữ như đĩa HD DVD và Blu-ray.
+ High 10 Profile (Hi10P): Profile này là sự phát triển của HiP với số bit mã
hóa và lượng tử là 10 bit (HiP 8 bit).
+ High 4:2:2 Profile (Hi422P): Profile này xử lý tín hiệu video một cách
chuyên nghiệp, profile này được xây dựng trên Hi10P hỗ trợ thêm định dạng 4:2:2,
sử dụng 10 bit cho mã hóa và lượng tử.
+ High 4:4:4 Predictive Profile: Profile này phát triển dựa trên Hi422P hỗ
trợ định dạng 4:4:4, sử dụng 14 bit cho việc mã hóa và lượng tử.
CB
P Baseline Extended Main High
High
10
High
4:2:2
High 4:4:4
Predictive
Slices I và P
Ye
s
Yes Yes Yes Yes Yes Yes Yes
Slices B No No Yes Yes Yes Yes Yes Yes
Slices SI và SP No No Yes No No No No No
Frames tham
chiếu
Ye
s
Yes Yes Yes Yes Yes Yes Yes
In-Loop
Deblocking
Filter
Ye
s
Yes Yes Yes Yes Yes Yes Yes
Luận văn tốt nghiệp - 15 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
CAVLC Entropy
Coding
Ye
s
Yes Yes Yes Yes Yes Yes Yes
CABAC Entropy
Coding No No No Yes Yes Yes Yes Yes
Flexible
Macroblock
Ordering (FMO)
No Yes Yes No No No No No
Arbitrary Slice
Ordering (ASO) No Yes Yes No No No No No
Redundant
Slices (RS) No Yes Yes No No No No No
Data
Partitioning No No Yes No No No No No
Interlaced
Coding (PicAFF,
MBAFF)
No No Yes Yes Yes Yes Yes Yes
Hệ số màu 4:2:0
Ye
s
Yes Yes Yes Yes Yes Yes Yes
Hệ số màu đơn
sắc (4:0:0) No No No No Yes Yes Yes Yes
Hệ số màu 4:2:2 No No No No No No Yes Yes
Hệ số màu 4:4:4 No No No No No No No Yes
Lấy mẫu 8 Bit
Ye
s
Yes Yes Yes Yes Yes Yes Yes
Lấy mẫu 9 và 10 No No No No No Yes Yes Yes
Lấy mẫu từ 11
đến 14 Bit No No No No No No No Yes
Biến đổi thích
nghi 8x8 và 4x4 No No No No Yes Yes Yes Yes
Quantization
Scaling Matrices No No No No Yes Yes Yes Yes
Điều kiển riêng
Cb và Cr No No No No Yes Yes Yes Yes
Mã hóa màu
riêng biệt No No No No No No No Yes
Luận văn tốt nghiệp - 16 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Mã hóa dự đoán
không tổn hao No No No No No No No Yes
Bảng 1.5: Các tham số của profile
Levels:
Số
level
Số MB
max/
giây
Kích
thước
khung
max
(MB)
Vmax
Baseline,
Extended
and Main
Profiles
Vmax
của
High
Profile
Vmax
của
High 10
Profile
Vmax của
High 4:2:2
and
High 4:4:4
Predictive
Các ví dụ về độ phân
giải cao @ khung
(lưu trữ khung tối đa)
trong levels
1 1485 99 64 Kbps
80
Kbps
192
Kbps 256 Kbps
128x96@30.9 (8)
176x144@15.0 (4)
1b 1485 99
128
Kbps
160
Kbps
384
Kbps 512 Kbps
128x96@30.9 (8)
176x144@15.0 (4)
1,1 3000 396
192
Kbps
240
Kbps
576
Kbps 68 Kbps
176x144@30.3 (9)
320x240@10.0 (3)
352x288@7.5 (2)
1,2 6000 396
384
Kbps
480
Kbps
1152
Kbps
1536
Kbps
320x240@20.0 (7)
352x288@15.2 (6)
1,3 11880 396
768
Kbps
960
Kbps
2304
Kbps
3072
Kbps
320x240@36.0 (7)
352x288@30.0 (6)
2 11880 396 2 Mbps 2,5 Mbps
6
Mbps 8 Mbp
320x240@36.0 (7)
352x288@30.0 (6)
2,1 19800 792 4 Mbps
5
Mbps
12
Mbps 16 Mbps
352x480@30.0 (7)
352x576@25.0 (6)
2,2 20250 1620 4 Mbps
5
Mbps
12
Mbps 16 Mbps
52x480@30.7 (10)
352x576@25.6 (7)
720x480@15.0 (6)
720x576@12.5 (5)
3 40500 1620 10 Mbps
12,5
Mbps
30
Mbps 40 Mbps
352x480@61.4 (12)
352x576@51.1 (10)
720x480@30.0 (6)
720x576@25.0 (5)
3,1 108000 3600 14 Mbps
17,5
Mbps
42
Mbps 56 Mbps
720x480@80.0 (13)
720x576@66.7 (11)
Luận văn tốt nghiệp - 17 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
1280x720@30.0 (5)
3,2 216000 5120 20 Mbps
25
Mbps
60
Mbps 80 Mbps
1280x720@60.0 (5)
1280x1024@42.2 (4)
4 245760 8192 20 Mbps
25
Mbps
60
Mbps 80 Mbps
1280x720@68.3 (9)
1920x1080@30.1 (4)
2048x1024@30.0 (4)
4,1 245760 8192 50 Mbps
62,5
Mbps
150
Mbps
200
Mbps
1280720@68.3 (9)
1920x1080@30.1 (4)
2048x1024@30.0 (4)
4,2 522240 8704 50 Mbps
62,5
Mbps
150
Mbps
200
Mbps
1920x1080@64.0 (4)
2048x1080@60.0 (4)
5 589824 22080
135
Mbps
168,7
Mbps
405
Mbps
540
Mbps
1920x1080@72.3(13)
2048x1024@72.0(13)
2048x1080@67.8(12)
2560x1920@30.7 (5)
3680x1536@26.7 (5)
5,1 83040 36864
240
Mbps
300
Mbps
720
Mbps 960 Mbps
1920x1080@120.5(16)
4096x2048@30.0 (5)
4096x2304@26.7 (5)
Bảng 1.6: Các tham số của level
Vmax: Là tốc độ bit cực đại của tín hiệu video
c) Tính kế thừa của chuẩn nén H.264 (MPEG-4 AVC)
Mục tiêu chính của chuẩn nén H.264 đang phát triển nhằm cung cấp video có
chất lượng tốt hơn nhiều so với những chuẩn nén video trước đây. Điều này có thể
đạt được nhờ sự kế thừa các lợi điểm của các chuẩn nén video trước đây. Không
chỉ thế, chuẩn nén H.264 còn kế thừa phần lớn lợi điểm của các tiêu chuẩn trước
đó là H.262 (MPEG-2) bao gồm 4 đặc điểm chính như sau:
Phân chia mỗi hình ảnh thành các Block (bao gồm nhiều điểm ảnh), do vậy
quá trình xử lý từng ảnh có thể được tiếp cận tới mức Block.
Khai thác triệt để sự dư thừa về mặt không gian tồn tại giữa các hình ảnh liên
tiếp bởi một vài mã của những Block gốc thông qua dự đoán về không gian, phép
biến đổi, quá trình lượng tử và mã hoá Entropy (hay mã có độ dài thay đổi VLC).
Khai thác sự phụ thuộc tạm thời của các Block của các hình ảnh liên tiếp bởi
vậy chỉ cần mã hoá những chi tiết thay đổi giữa các ảnh liên tiếp. Việc này được
Luận văn tốt nghiệp - 18 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
thực hiện thông qua dự đoán và bù chuyển động. Với bất kỳ Block nào cũng có thể
được thực hiện từ một hoặc vài ảnh mã hoá trước đó hay ảnh được mã hoá sau đó
để quyết định vector chuyển động, các vector này được sử dụng trong bộ mã hoá
và giải mã để dự đoán các loại Block.
Khai thác tất cả sự dư thừa về không gian còn lại trong ảnh bằng việc mã
các block dư thừa. Ví dụ như sự khác biệt giữa block gốc và block dự đoán sẽ được
mã hoá thông qua quá trình biến đổi, lượng tử hoá và mã hoá Entropy.
d) Cơ chế nén ảnh của H.264 (MPEG-4 AVC)
Với chuẩn nén H264, mỗi hình ảnh được phân chia thành nhiều block, mỗi
block tương ứng với một số lượng nhất định các MacroBlock. Ví dụ một hình ảnh
có độ phân giải QCIF (tương đương với số lượng điểm ảnh 176x144) sẽ được chia
thành 99 MacroBlock với kích cỡ 16x16. Một sự phân đoạn các MacroBlock tương
tự được sử dụng các kích cỡ ảnh khác. Thành phần chói của ảnh được lấy mẫu
tương ứng với độ phân giải của ảnh đó, trong khi đó thành phần màu CR và CB được
lấy mẫu với tần số thấp hơn theo 2 chiều ngang và dọc. Thêm vào đó mỗi hình ảnh
có thể được phân thành số nguyên lần các lát (slice), việc này rất có giá trị cho
việc tái đồng bộ trong trường hợp lỗi dữ liệu.
Giảm bớt độ dư thừa: Cũng giống như các bộ giải mã khác, H.264 nén
video bằng cách giảm bớt độ dư thừa cả về không gian và thời gian trong hình ảnh.
Những dư thừa về mặt thời gian là những hình ảnh giống nhau lặp đi lặp lại từ
khung (frame) này sang khung khác, ví dụ như phần phông nền không chuyển động
của một chương trình đối thoại trên truyền hình. Dư thừa về không gian là những
chi tiết giống nhau xuất hiện trong cùng một khung, ví dụ như nhiều điểm ảnh
giống nhau tạo thành một bầu trời xanh.
Chọn chế độ, phân chia và chế ngự: Bộ lập giải mã bắt đầu bằng việc
quyết định loại khung cần nén tại một thời điểm nhất định và chọn chế độ mã hoá
phù hợp. Chế độ “Intra” tạo ra ảnh “I”, trong khi chế độ “Inter” tạo ra khung “P”
hoặc “B". Sau đó, bộ mã hoá sẽ chia ảnh thành hàng trăm hàng và cột các điểm
ảnh của ảnh video số chưa nén thành các khối nhỏ hơn, mỗi khối có chứa một vài
hàng và cột điểm ảnh.
Nén theo miền thời gian: Khi bộ mã hoá đang hoạt động ở chế độ “giữa
khối” (inter), khối này sẽ phải qua công đoạn hiệu chỉnh chuyển động. Quá trình
này sẽ phát hiện ra bất kỳ chuyển động nào diễn ra giữa khối đó và một khối tương
ứng ở một hoặc hơn một ảnh tham chiếu đã được lưu trữ từ trước, sau đó tạo ra một
khối “chênh lệch” hoặc “lỗi”. Thao tác này sẽ giảm bớt dữ liệu trong mỗi block
một cách hiệu quả do chỉ phải trình bày chuyển động của nó mà thôi. Tiếp đến là
công đoạn biến đổi côsin rời rạc (DCT-Discrete Cosine Transform) để bắt đầu nén
Luận văn tốt nghiệp - 19 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
theo miền không gian. Khi bộ mã hoá hoạt động ở chế độ “trong khối” (intra), khối
này sẽ bỏ qua công đoạn hiệu chỉnh chuyển động và tới thẳng công đoạn DCT.
Nén theo miền không gian: Các khối thường có chứa các điểm ảnh tương tự
hoặc thậm chí giống hệt nhau. Trong nhiều trường hợp, các điểm ảnh thường không
thay đổi mấy (nếu có). Như vậy có nghĩa là tần số thay đổi giá trị điểm ảnh trong
khối này là rất thấp. Những khối như thế được gọi là khối có tần số không gian
thấp. Bộ lập mã lợi dụng đặc điểm này bằng cách chuyển đổi các giá trị điểm ảnh
của khối thành các thông tin tần số trong công đoạn biến đổi côsin rời rạc.
+ Biến đổi cosin rời rạc:
Công đoạn DCT biến đổi các giá trị điểm ảnh của khối thành một ma trận
gồm các hệ số tần số ngang, dọc đặt trong không gian tần số. Khi khối ban đầu có
tần số không gian thấp, DCT sẽ tập hợp phần lớn năng lượng vào góc tần số thấp
của mạng. Nhờ vậy, những hệ số tần số thấp ở góc đó sẽ có giá trị cao hơn.
Một số lượng lớn các hệ số khác còn lại trên ma trận đều là các hệ số có tần
số cao, năng lượng thấp và có giá trị thấp. Hệ số DC và một vài hệ số tần số thấp
sẽ hàm chứa phần lớn thông tin được mô tả trong khối ban đầu. Điều này có nghĩa
là bộ lập mã có thể loại bỏ phần lớn hệ số tần số cao còn lại mà không làm giảm
đáng kể chất lượng hình ảnh của khối.
Bộ lập mã chuẩn bị các hệ số cho công đoạn này bằng cách quét chéo mạng
lưới theo đường zig-zag, bắt đầu từ hệ số DC và qua vị trí của các hệ số ngang dọc
tăng dần. Do vậy nó tạo ra được một chuỗi hệ số được sắp xếp theo tần số.
+ Lượng tử hoá và mã hoá entropy:
Tại đây thao tác nén không gian mới thực sự diễn ra. Dựa trên một hệ số tỷ lệ
(có thể điều chỉnh bởi bộ mã hoá), bộ lượng tử hoá sẽ cân đối tất cả các giá trị hệ
số. Do phần lớn hệ số đi ra từ DCT đều mang năng lượng cao nhưng giá trị thấp
nên bộ lượng tử hoá sẽ làm tròn chúng thành 0. Kết quả là một chuỗi các giá trị hệ
số đã được lượng tử hoá bắt đầu bằng một số giá trị cao ở đầu chuỗi, theo sau là
một hàng dài các hệ số đã được lượng tử hoá về 0. Bộ lập mã entropy có thể theo
dõi số lượng các giá trị 0 liên tiếp trong một chuỗi mà không cần mã hoá chúng,
nhờ vậy giảm bớt được khối lượng dữ liệu trong mỗi chuỗi.
e) Các ưu điểm nổi bật của chuẩn nén H.264 (MPEG-4 AVC)
Ưu điểm của nén không gian:
Chuẩn nén MPEG-4 AVC có hai cải tiến mới trong lĩnh vực nén không gian.
Trước hết, bộ lập mã này có thể tiến hành nén không gian tại các macroblock
16x16 điểm ảnh thay vì các block 8x8 như trước đây. Điều này giúp tăng cường
Luận văn tốt nghiệp - 20 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
đáng kể khả năng nén không gian đối với các hình ảnh có chứa nhiều khoảng lớn
các điểm ảnh giống nhau.
Thứ hai là thao tác nén được tiến hành trong miền không gian trước khi công
đoạn DCT diễn ra. Chuẩn nén MPEG-4 AVC so sánh macroblock hiện thời với các
macroblock kế bên trong cùng một khung, tính toán độ chênh lệch, và sau đó sẽ chỉ
gởi đoạn chênh lệch tới DCT. Hoặc là nó có thể chia nhỏ macroblock 16x16 điểm
ảnh thành các khối 4x4 nhỏ hơn và so sánh từng khối này với các khối kế bên trong
cùng một macroblock. Điều này giúp cải thiện khả năng nén ảnh chi tiết.
Ưu điểm của nén thời gian:
Điểm cải tiến lớn nhất ở MPEG-4 AVC là chế độ mã hoá giữa. Những phương
pháp tiên tiến ở chế độ này khiến cho nén thời gian đạt đến một cấp độ cao hơn
nhiều, cùng với chất lượng chuyển động tốt hơn so với các chuẩn MPEG trước đây.
Kích cỡ khối:
Ở chế độ giữa khối, MPEG-2 chỉ hỗ trợ các macroblock 16x16 điểm ảnh,
không đủ độ phân giải để mã hoá chính xác các chuyển động phức tạp hoặc phi
tuyến tính, ví dụ như phóng hay to thu nhỏ. Ngược lại, MPEG-4 AVC lại tăng
cường hiệu chỉnh chuyển động bằng cách cho phép bộ lập mã biến đổi kích cỡ
thành phần chói của mỗi macroblock. (Bộ lập mã sử dụng thành phần chói như vậy
là do mắt người nhạy cảm với chuyển động chói hơn nhiều so với chuyển động
màu.) MPEG-4 AVC có thể chia thành phần chói của từng macroblock thành 4 cỡ:
16x16, 16x8, 8x16 hoặc 8x8. Khi sử dụng khối 8x8, nó còn có thể chia tiếp 4 khối
8x8 này thành 4 cỡ nữa là 8x8, 8x4, 4x8 hoặc 4x4.
Hình 1.1: MPEG-4 AVC có thể phân chia thành phần chói của từng
MacroBlock theo nhiều cách để tối ưu hoá việc bù chuyển động.
Việc phân chia các macroblock cho phép bộ lập mã xử lý được một vài loại
chuyển động tuỳ theo độ phức tạp của chuyển động đó cũng như nguồn lực về tốc độ
bit. Nhìn chung, kích cỡ phân chia lớn phù hợp với việc xử lý chuyển động tại các
khu vực giống nhau trong ảnh, trong khi đó kích cỡ phân chia nhỏ lại rất có ích khi xử
Luận văn tốt nghiệp - 21 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
lý chuyển động tại các chỗ có nhiều chi tiết hơn. Kết quả là chất lượng hình ảnh cao
hơn, ít bị vỡ khối hơn.
Các cuộc thử nghiệm đã chỉ ra rằng việc sắp xếp hợp lý các khung có thể tăng
tỷ lệ nén thêm 15%. MPEG-4 AVC lấy phần chói của ảnh gốc và sử dụng các
macroblock đã được chia nhỏ tại các khu vực có nhiều chi tiết nhằm tăng cường
khả năng hiệu chỉnh chuyển động.
+ Độ chính xác trong hiệu chỉnh chuyển động
Trong đa số trường hợp, chuyển động tại rìa mỗi macroblock hay khối thường
diễn ra với độ phân giải nhỏ hơn một điểm ảnh. Do vậy, chuẩn nén MPEG-4 AVC
có thể đảm bảo độ chính xác trong hiệu chỉnh chuyển động lên tới 1/4 hoặc 1/8
điểm ảnh, trong khi các chuẩn MPEG trước đây chỉ dừng lại ở mức 1/2 điểm ảnh.
Khả năng đạt mức chính xác 1/8 ảnh điểm của MPEG-4 AVC giúp tăng hiệu suất
mã hoá tại tốc độ bit cao và độ phân giải video cao. Các thử nghiệm cho thấy độ
chính xác đến 1/4 điểm ảnh có thể làm giảm tốc độ bit xuống hơn 15% so với độ
chính xác 1 điểm ảnh.
+ Chọn nhiều hình tham chiếu
Chuẩn nén MPEG-2 chỉ dựa trên hai khung tham chiếu để dự đoán các chuyển
động mang tính chu kỳ. Tuy nhiên, khi camera thay đổi góc quay hay chuyển qua
chuyển lại giữa các cảnh, việc chỉ sử dụng hai khung tham chiếu không còn phù hợp
để dự đoán chính xác chuyển động. Tương tự như vậy, để đoán trước các chuyển động
phức tạp như sóng biển hay một vụ nổ, ta cần phải có nhiều hơn hai khung tham chiếu.
Vì thế, chuẩn MPEG-4 AVC cho phép có tới năm khung tham chiếu phục vụ cho việc
mã hoá giữa khung. Kết quả là chất lượng video tốt hơn và hiệu suất nén cao hơn.
+ Giải khối tích hợp
Video số sau khi nén thường tạo ra một hiệu ứng gọi là “kết khối”, có thể thấy
rõ tại điểm giao nhau giữa các khối, đặc biệt là khi có tốc độ bit thấp. Hiệu ứng này
là do công đoạn xử lý sử dụng nhiều loại chuyển động và bộ lượng tử khác nhau. Đối
với MPEG-2, cách duy nhất để ngăn chặn hiệu ứng này là sử dụng các cơ chế hậu xử
lý phù hợp, tuy nhiên các cơ chế này lại không tương thích được với tất cả các máy
thu. Chuẩn nén MPEG-4 AVC đưa vào sử dụng một bộ lọc giải khối hoạt động ở hai
cấp độ: macroblock 16x16 và khối 4x4. Việc giải khối thường tạo ra một tỉ số tín
hiệu trên nhiễu (SNR-Signal-to-noise ratio) cực điểm thấp hơn, tuy nhiên nhìn một
cách chủ quan thì nó tạo ra hình ảnh chất lượng tốt hơn.
Ưu điểm về lượng tử hoá và biến đổi:
Chấm di động 8x8 DCT cùng với dung sai của lỗi làm tròn chính là phần cốt
lõi của các chuẩn MPEG trước đây. MPEG-4 AVC độc đáo hơn ở chỗ nó sử dụng
Luận văn tốt nghiệp - 22 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
biến đổi không gian nguyên (gần giống như DCT) đối với các khối 4x4 điểm ảnh.
Kích cỡ nhỏ giúp giảm bớt hiện tượng “kết khối”, trong khi thông số nguyên tuyệt
đối giúp loại bỏ nguy cơ không thích ứng giữa bộ lập mã và giải mã trong phép
biến đổi ngược. Thêm vào đó, dãy hệ số xích lượng tử lớn hơn khiến cho cơ chế
kiểm soát tốc độ dữ liệu ở bộ lập mã hoạt động một cách linh hoạt hơn dựa trên
một tỉ lệ phức hợp vào khoảng 12,5% thay cho một mức tăng lượng gia không đổi.
Ưu điểm đối với mã hoá entropy:
Sau khi tiến hành hiệu chỉnh, biến đổi và lượng tử hoá chuyển động, các bộ
lập mã MPEG trước đây sẽ vạch ra các symbol biểu diễn vector chuyển động và hệ
số đã lượng tử hoá thành các bit thực sự. Ví dụ như chuẩn nén MPEG-2 sử dụng
phương pháp mã có chiều dài biến thiên tĩnh (VLC-Variable-length code) không
thể tối ưu hoá trong môi trường video thời gian thực (trong đó nội dung và các cảnh
biến đổi theo thời gian).
MPEG-4 AVC sử dụng mã hoá thuật toán nhị phân theo tình huống CABAC
(Context-Adaptive Binary Arithmetic Coding). Hiệu suất mã hoá của CABAC cao
hơn hẳn nhờ khả năng thích nghi với các thay đổi có thể xảy ra trong phân bổ
symbol. Ví dụ, nó có thể khai thác sự tương quan giữa các symbol và từ đó sử dụng
sự tương quan bit và thuật toán mã hoá. Cơ chế này có thể giúp tiết kiệm thêm một
lượng bit vào khoảng hơn 5%.
f) Kết luận
MPEG-4 AVC đánh dấu một bước ngoặt trong lĩnh vực nén video, áp dụng
các kỹ thuật tiên tiến nhằm mục đích sử dụng băng thông hiệu quả hơn và đem lại
chất lượng ảnh cao hơn. Với các kỹ thuật này, MPEG-4 AVC có thể giảm tốc độ bit
xuống hơn 50% so với chuẩn MPEG-2. Tuy nhiên, MPEG-4 AVC đòi hỏi một cấp
độ phức tạp cao hơn trong cả quá trình mã hóa lẫn giải mã. Mặc dù vậy, thử thách
này hoàn toàn có thể chinh phục được nhờ có những tiến bộ mới liên tiếp trong khả
năng xử lý phần mềm cũng như phần cứng. Điều này có nghĩa là MPEG-4 AVC có
khả năng thay thế hoàn toàn MPEG-2 trong thời gian tới.
Luận văn tốt nghiệp - 23 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Chương 2: Công nghệ nén và ghép kênh
1. Công nghệ nén
1.1 Nhu cầu của công nghệ nén trong truyền hình
Với công nghệ số phát triển vượt bậc như hiện nay, các thiết bị đều có dải
thông nhất định, các dòng tín hiệu số tốc độ cao yêu cầu dải thông rất rộng vượt
quá khả năng cho phép của các thiết bị. Một cách sơ bộ, nén là quá trình làm giảm
tốc độ bit của các dòng dữ liệu tốc độ cao mà vẫn đảm bảo chất lượng dữ liệu cần
lưu trữ hoặc truyền tải.
Ví dụ như tín hiệu video sau khi được số hóa 8 bit có tốc độ 216 Mbps, với tốc
độ này vượt quá khả năng truyền của một kênh truyền hình, vì vậy trong lĩnh vực
truyền hình việc sử dụng công nghệ nén gần như tất yếu để giảm tốc độ bit.
Trung tâm của mạng phát sóng video số bao gồm hệ thống nén, nó cung cấp
chương trình video, audio chất lượng cao cho người xem bằng cách chỉ sử dụng một
phần nhỏ độ rộng băng tần mạng. Mục đích của nén dữ liệu là tối thiểu hóa khả năng
lưu trữ và truyền dẫn phát sóng thông tin (ghép nhiều thông tin vào một dòng truyền).
Hệ thống nén tín hiệu bao gồm các bộ mã hóa số và các bộ ghép kênh, các bộ
giải mã có nhiệm vụ chuyển tín hiệu analog sang số có nén và xáo trộn thành một
dòng audio-video và dữ liệu khác dưới dạng số có nén. Mã hóa số cho phép truyền
dẫn phát sóng nhiều chương trình audio-video chất lượng cao qua cùng độ rộng băng
tần như một kênh sóng audio-video analog (8 MHz ở Việt Nam).
1.2 Công nghệ nén audio chuẩn ISO/MPEG-1
Đây là tiêu chuẩn mã hóa audio với tần số lấy mẫu là 32,441 KHz và 48 KHz,
tốc độ bit khoảng 32-192 Kbps cho âm thanh mono và 64-384 Kbps cho âm thanh
stereo.
Có hai phương pháp để giảm tốc độ bit của tín hiệu audio:
Phương pháp 1: Chủ yếu là loại bỏ tín hiệu dư thừa audio bằng phép tương
quan thống kê.
Phương pháp 2: Sử dụng che mặt nạ thời gian và phổ tần số.
Sử dụng hai phương pháp trên thì tốc độ bit cần truyền giảm xuống 200 Kbps
và thậm chí thấp hơn đối với âm thanh stereo.
Sau đây là sơ đồ hệ thống audio trong truyền hình số.
Luận văn tốt nghiệp - 24 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Hình 2.1: Hệ thống audio trong truyền hình số
Sau đây ta xét sơ đồ mạch mã hóa và giải mã của hệ thống audio lớp 1 và 2
theo tiêu chuẩn (ISO/MPEG).
Hình 2.2: Sơ đồ khối mạch mã hoá audio lớp 1 và 2 theo chuẩn ISO/IEC 11172-1,
2
Tùy thuộc vào từng ứng dụng khác nhau, hệ thống mã hóa tín hiệu audio có
ba lớp với mức độ phức tạp tăng dần. Đối với cả ba lớp tín hiệu được biến đổi từ
miền thời gian sang miền tần số bằng 32 băng lọc phụ.
Hình 2.3: Sơ đồ khối mạch giải mã audio lớp 1 và 2 theo chuẩn ISO/IEC 11172-2
Dữ liệu
audio đã
mã hóa
Mô hình “Tâm
lý âm thanh”
Biểu số FFT
(1024 điểm)
Băng lọc
(32 băng phụ)
Lượng tử hóa
tuyến tính
Mã hóa các
thông tin phụ
Định
dạng
dòng bit
và mã
sữa sai
Điều kiển từ
xa
Dữ liệu
audio vào
Dữ liệu phụ
0
31 31
0
Audio
vào
Inner
Interleaver
Giải mã
audio
Mở gói PES
Mã hóa
audio
Đóng gói Đóng gói
Giải điều
chế RF
Dòng ES Dòng PES
Dòng PES
RF
Audio
ra
Tách
kênh và
phát
hiện lỗi,
sửa sai
Giải
lượng tử
Quá trình
ngược của
băng lọc
(32 băng
phụ)
Giải mã thông
tin phụ
Dữ liệu đã
mã hoá
Dữ liệu phụ
0
31 31
0 Tín hiệu audio
stereo
Luận văn tốt nghiệp - 25 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Lớp 1, 2 biểu thị tín hiệu audio đầu vào bằng 32 băng lọc phụ, những thông số
này được lượng tử hóa và mã hóa dưới sự khống chế của mô hình âm thanh.
Lớp 1 chỉ biến thể giản ước của phương pháp mã hóa MPEG-1 và được sử
dụng chủ yếu trong các ứng dụng dân dụng.
Lớp 2 thực hiện việc nén tín hiệu và thực hiện việc lượng tử hóa tinh hơn, ứng
dụng nhiều kể cả dân dụng lẫn chuyên dụng.
Hình 2.4: Sơ đồ khối mạch giải mã audio lớp 3 theo chuẩn ISO/IEC 11172-3
Hình 2.5: Sơ đồ khối mạch giải mã audio lớp 3 theo chuẩn ISO/IEC 11172-3
Lớp 3 là sự mã hóa các môđun hiệu quả của 2 loại mã ASPEC và MUSICAM.
Mỗi băng lọc phụ lại được chia nhỏ nhiều đường nên có độ phân giải cao hơn. Ở lớp
này nếu muốn hiệu quả nén cao phải dùng phương pháp lượng tử hóa phi tuyến.
1.3 Công nghệ nén video chuẩn MPEG
1.3.2 Nén video theo chuẩn MPEG-1
Tiêu chuẩn MPEG-1 gồm 4 phần:
Phần 1: Hệ thống (ISO/IEC 11172-1).
Phần 2: Nén video (ISO/IEC 11172-2).
Phần 3: Nén audio (ISO/IEC 11172-3).
Dữ liệu
audio đã
mã hoá
Dữ liệu
audio vào
Biểu số
FFT
(1024
điểm)
Băng
lọc
(32
băng
phụ)
DCT
Mã hóa các
thông tin phụ
Định
dạng
dòng
bit và
mã sữa
sai
Mô
hình
Điều kiển
từ xa
Dữ liệu phụ
0
31 575
0
-Vòng kiểm
soát méo
-Lượng tử hoá
phi tuyến tính
-Vòng kiểm
soát tốc độ bít
0
575
Mã hoá
Huffanm
0
575
Tín hiệu
audio
stereo
Tăng kênh
và phát
hiện lỗi,
sữa sai
DCT
Giải mã thông
tin phụ
Quá trình
ngược
của băng
lọc (32
băng phụ)
Dữ liệu
audio vào
Dữ liệu phụ
0
575 31
0
Giải lượng
tử
0
575
DCT
0
31
Luận văn tốt nghiệp - 26 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Phần 4: Kiểm tra (ISO/IEC 11172- 4).
MPEG-1 nghiên cứu cách thức ghép nối một hoặc vài dòng dữ liệu chứa thông tin
thời gian để hình thành nên một dòng dữ liệu. Nó cung cấp qui tắc cú pháp đồng bộ
hoá quá trình phát lại cho một dải ứng dụng video rộng. MPEG-1 coi ảnh chuyển động
như dạng thức dữ liệu máy tính (gồm các điểm ảnh). Cũng như các dữ liệu máy tính
(ảnh và văn bản), ảnh video chuyển động có khả năng truyền và nhận bằng máy tính
và mạng truyền thông. Chúng cũng có thể được lưu trữ trong các thiết bị lưu trữ dữ liệu
số như đĩa CD và ổ quang.
MPEG-1 cung cấp cả các ứng dụng đối xứng và không đối xứng:
Trong ứng dụng không đối xứng, ảnh động được nén một lần, sau đó giải
nén nhiều lần để truy cập thông tin, ví dụ trò chơi games.
Trong ứng dụng đối xứng, quá trình nén và giải nén phải cân bằng nhau. Ví
dụ: điện thoại hình, thư điện tử.
Để đạt được hiệu suất nén cao mà vẫn giữ tốt chất lượng ảnh phục hồi, chuẩn
MPEG-1 sử dụng cả công nghệ nén trong ảnh (Intraframe) và liên ảnh (Interframe)
để loại bỏ được cả sự dư thừa không gian và thời gian.
Do MPEG-1 được phát triển cho lưu trữ dữ liệu số nên đòi hỏi có sự truy cập
ngẫu nhiên (Random Access). Cách thức mã hoá tốt nhất cho truy cập ngẫu nhiên là
mã hoá Intraframe đơn thuần. Song do sự dư thừa thông tin về thời gian chưa được
loại bỏ nên hiệu suất nén rất thấp. Do vậy trong tiêu chuẩn nén MPEG-1, có sự cân
bằng giữa nén trong ảnh và nén liên ảnh bằng cách sử dụng các công nghệ sau đây:
Bù chuyển động.
Dự báo.
Nội suy.
Biến đổi cosine rời rạc.
Lượng tử hoá.
Mã•hoá độ dài thay đổi (mã Huffman-VLC).
Tức là có sự kết kết hợp hai công nghệ nén DPCM (Differential Pluse Code
Modulation–điều chế mã xung vi sai) và TC (Trasform Codin-mã hóa chuyển đổi).
Thuật toán nén MPEG-1 sử dụng bù chuyển động khối để giảm sự dư thừa thời
gian với vector chuyển động cho mỗi khối kích thước 16x16 điểm ảnh. Bù chuyển
động được sử dụng cho cả dự báo nhân quả và không nhân quả.
Dự báo nhân quả tạo dự báo ảnh hiện hành từ ảnh trước đó.
Dự báo không nhân quả tạo dự báo cho ảnh hiện hành dựa trên ảnh trong
quá khứ và cả tương lai.
Luận văn tốt nghiệp - 27 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Vòng lặp DPCM được sử dụng để tạo khung sai số dự báo. Sau đó, công
nghệ mã hoá chuyển đổi chuyển khung sai số này sang miền tần số để nén các hệ
số nhờ lượng tử hoá và mã hoá Huffman trước khi truyền tải hay lưu trữ.
a) Các thành phần ảnh cơ bản trong chuẩn nén MPEG
Các tiêu chuẩn MPEG, cấu trúc dữ liệu đều ở dạng lớp. Bao gồm các thành
phần cơ bản sau đây:
Hình 2.6: Cấu trúc lớp dữ liệu trong MPEG
Khối (Block): Là đơn vị cơ bản cho chuyển đổi DCT. Bao gồm 8x8 điểm
ảnh tín hiệu chói hoặc tín hiệu màu.
Macro Block: Là nhóm các khối DCT tương ứng với thông tin của một cửa
sổ 16x16 điểm ảnh gốc. Có nhiều dạng Macro Block khác nhau phụ thuộc vào cấu
trúc lấy mẫu được sử dụng.
Lớp nhóm ảnh
(GOP layer)
Lớp khung
(Frame layer)
MB MB
MB
MB
MB
MB
MB
MB
MB
MB
Khung I Khung B
Khung P
Khung B
Khung I
Khung B
GOP #p GOP #p+1 GOP #p+2
GOP #p+3
GOP #p+4
GOP #p+5
Chuỗi video #1
Chuỗi video #2
Chuỗi video #n
Đặc điềm MB Vecto chuyển động Khối Y Khối Y Khối Y Khối Y Khối CB Khối CR
Các hệ số DCT EOB
8x8 điểm chói
Lớp chuỗi ảnh
(Sequence layer)
Sequence
header)
Sequence
end code
Dòng sơ cấp
GOP header
Frame header
Slice header
Lớp lát (Slice
layer)
Dữ liệu khung CCIR-601
Lớp MB
(Macrokblock
layer)
Lớp khối DCT
(Block layer)
Luận văn tốt nghiệp - 28 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Hình 2.7: Cấu trúc Macroblock của các dạng lấy mẫu
Phần đầu đề (header) của Macroblock chứa thông tin phân loại (Y hay CB,
CR) và vector bù chuyển động tương ứng.
Lát (slice): Được cấu thành từ một hay một số MB liên tiếp nhau.
Phần header của slice chứa thông tin về vị trí của nó trong ảnh và tham số
quét lượng tử (quantized scaling factor). Kích cỡ của slice quyết định bởi mức bảo
vệ lỗi cần có trong ứng dụng vì bộ giải mã sẽ bỏ qua slice bị lỗi. Hệ số một
chiều DC được định vị tại điểm bắt đầu mỗi slice.
Ảnh: Lớp ảnh cho bên thu biết về loại mã hoá khung ( I,P,B). Phần
header mang thứ tự, ngoài ra còn có một số thông tin bổ sung như thông tin đồng
bộ, độ phân giải và vector chuyển động.
Nhóm ảnh (GOP-group of picture): Gồm cấu trúc các ảnh I, B và P. Mỗi
nhóm bắt đầu bằng ảnh I cung cấp điểm vào ra và tìm kiếm. Phần header chứa
25 bit thời gian và chế độ điều khiển cho VTR và thông tin thời gian.
Chuỗi Video (Video Sequence): Lớp chuỗi bao gồm phần header, một
hoặc một số nhóm ảnh (Picture Group) và phần kết thúc chuỗi (Sequence end
Code). Thông tin quan trọng nhất của phần header là kích thước (dọc, ngang)
của mỗi ảnh, tốc độ bit, tốc độ ảnh và dung lượng đòi hỏi bộ đệm dữ liệu
bên thu. Thông tin chuỗi ảnh và phần header của chuỗi là dòng bit đã mã hoá,
còn gọi là dòng video cơ bản.
Trong MPEG có các cấu trúc nhóm ảnh điển hình như sau:
1
2
3
4
1
2
3
4
5
6
7
8
9
10
11
12
5 6 6 2 5 1
1
2
3
4
4 3
4:2:2 Macroblock 4:4:4 Macroblock
4:2:0 Macroblock 4:1:1 Macroblock
Y
Y
CB CR
CB CR
CB/B CR/R Y/G
Y CB CR
5 7
8 6
Luận văn tốt nghiệp - 29 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Hình 2.8: Các cấu trúc nhóm ảnh trong tiêu chuẩn MPEG
b) Sự phân loại ảnh trong MPEG
Tiêu chuẩn nén video MPEG định nghĩa 3 loại ảnh: ảnh I, ảnh B và ảnh P.
Ảnh I: (Intra - Coded Picture)
Các ảnh I được mã hoá theo mode Intra để có thể giải mã mà không cần sử
dụng dữ liệu từ bất cứ một ảnh nào khác. Đặc điểm của phương pháp mã hoá
này như sau:
+ Chỉ loại bỏ được sự dư thừa không gian.
+ Dùng các điểm trong cùng một khung để tạo dự báo.
+ Không có bù chuyển động.
+ Các thông tin được mã hoá rõ ràng, minh bạch nên số lượng bit yêu cầu lớn.
Do được mã hoá Intra, ảnh I bao giờ cũng là ảnh đầu tiên trong một nhóm ảnh
hay một chuỗi ảnh. Nó cung cấp thông tin khởi động các ảnh tiếp theo trong nhóm.
Ảnh P (Predictive Code Picture)
Ảnh P được mã hoá liên ảnh một chiều (Interframe một chiều):
+ Dự báo Inter một chiều.
F1
F2
F3
F4
F5
F6
F7
F8
F9
F10
I
B
B
P
B
B
P
B
B
I
I
B
I
I
B
P
I
P
Khung CCIR-601 nguyên thủy
Khung
đã nén
Cấu trúc IBBPBBPBBI
Cấu trúc IBI Cấu trúc IBP Cấu trúc IP
Luận văn tốt nghiệp - 30 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
+ Ảnh dự báo được tạo ảnh tham chiếu trước đó (dự báo nhân quả). Ảnh
tham chiếu này có thể là ảnh I hoặc ảnh P gần nhất.
+ Có sử dụng bù chuyển động. Thông tin ước lượng chuyển động của các khối
nằm trong vector chuyển động (motion vector). Vector này xác định Macroblock nào
được sử dụng từ ảnh trước.
Do vậy ảnh P bao gồm cả những MB mã hoá Inter (I - MB) là những macroblock
chứa thông tin lấy từ ảnh tham chiếu và những MB mã hoá Intra là những MB chứa
thông tin không thể mượn từ ảnh trước. Ảnh P có thể được sử dụng làm ảnh tham
chiếu tạo dự báo cho ảnh sau.
Ảnh B (Bidirectionally Predicted Pictures)
Ảnh B là ảnh mã hoá liên ảnh hai chiều. Tức là :
+ Có sử dụng bù chuyển động.
+ Dự báo không nhân quả, ảnh dự báo gồm các macroblock của cả khung
hình trước đó và sau đó.
Việc sử dụng thông tin lấy từ ảnh trong tương lai hoàn toàn có thể thực hiện
được vì tại thời điểm mã hoá thì bộ mã hoá đã sẵn sàng truy cập tới ảnh phía sau.
Ảnh B không được sử dụng làm ảnh tham chiếu tạo dự báo cho các ảnh sau.
Hình 2.9: Nội suy bù chuyển động
Khung dự báo (P) = Khung trước – Khung hiện hành + Vecto chuyển động
Khung kề trước (n) Khung hiện hành (n+1)
Vùng không bao phủ
Dự báo bù chuyển động bù ảnh P
Khung dự báo (B) = Khung trước – Khung hiện hành + Vecto chuyển động hai chiều
Khung hiện hành (n)
Vị trí nội suy
Đường di chuyển
của vật thể
Khung kề trước (n-1) Khung kề sau (n+1)
Dự báo bù chuyển động bù ảnh B
Luận văn tốt nghiệp - 31 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Thứ tự truyền dẫn và thứ tự hiển thị ảnh:
Chuỗi ảnh MPEG thường có cấu trúc IBBPBBPBBI nhưng thứ tự truyền dẫn
và thứ tự hiển thị ảnh là khác nhau do khi tạo ảnh B cần thông tin từ cả khung quá
khứ và tương lai. Như vậy có nghĩa, ảnh trong tương lai cần phải được truyền dẫn
trước. Trong khi đó, lúc hiển thị phải theo đúng thứ tự nguồn. Để thực hiện điều
này, lớp ảnh (Picture layer) của dòng dữ liệu MPEG có thông tin về số thứ tự ảnh
để trợ giúp hiển thị.
Hình 2.10: Thứ tự truyền dẫn và thứ tự hiển thị ảnh
c) Tiêu chuẩn MPEG-1
MPEG-1 có phạm vi ứng dụng rộng rãi cho dạng thức CSIF (Common
Source Intermediate Format). CSIF là một định dạng nguồn dữ liệu đầu vào của
các bộ nén và giải nén (codec) do CCITT qui định phù hợp với hai dạng
quét TV 525dòng/60Hz và 625dòng/50Hz. Dạng thức này gắn với cấu trúc lấy
mẫu 4:2:0 được qui định như sau:
CCIR - 601
525
CSIF- 525
4:2:0
CCIR - 601
625
CSIF - 625
4:2:0
Số điểm/dòng tích cực
+ Chói Y 720 352 720 352
+ màu (CB, CR) 360 176 360 176
Tần số lấy mẫu
Thứ tự
khung
góc
F1
F2
F3
F4
F5
F6
F7
F8
F9
F10
I1
B2
B3
P4
B5
B6
P7
B8
B9
I10
I1
P4
B2
B3
P7
B5
B6
I10
B8
B9
Thứ tự
hiển
thị
Thứ tự
truyền
dẫn
Luận văn tốt nghiệp - 32 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
+ Chói Y 13.5 6.75 13.5 6.75
+ màu (CB, CR) 6.75 3.38 6.75 3.38
Số dòng tích cực
+ Chói Y 480 240 576 288
+ màu (CB, CR) 480 120 576 144
Tốc độ khung (Hz) 30 20 25 25
Tỉ lệ khung ảnh 4:3 4:3 4:3 4:3
Bảng 2.1: Dạng thức ảnh cơ bản của CSIF
Như vậy đối với MPEG-1, dòng dữ liệu truyền hình chuẩn theo CCIR- 601 phải
được biến đổi sang dạng CSIF bằng một bộ chuyển đổi (converter). Điều này được
thực hiện bằng cách sử dụng bộ lọc dòng (horizontal decimation filter) cho tín hiệu
chói mành lẻ và bộ lọc dòng và mành cho tín hiệu CR, CB mành lẻ. Quá trình giải
mã tại bộ thu phải dự báo mành chẵn từ mành lẻ nội suy.
Để giảm mức độ phức tạp và giá thành bộ giải mã, trong MPEG 1 một
số tham số được mặc định thành hằng số như sau:
Tham số Giá trị cực đại
Độ rộng ảnh 768 điểm
Chiều cao ảnh 576 dòng
Tốc độ ảnh 30 ảnh/s
Số lượng MB (Macroblock) 396
Giải vector chuyển động 64 điểm
Kích thước bộ đệm đầu vào 327.680 bit
Tốc độ bit 1,8 Mbps
Bảng 2.2: Các tham số mặc định trong chuẩn MPEG-1
Cú pháp dòng bit gồm 6 lớp như đã mô tả ở bảng 2.3.
Sử dụng cả hai dạng thức nén:
Nén Intra: Biến đổi DCT, lượng tử hoá, mã hoá VLC cho ảnh I.
Nén Inter: Ước lượng chuyển động, tạo dự báo có bù chuyển động cho ảnh B
và ảnh P.
MPEG 1 có một số tiêu chuẩn cơ bản như sau:
Luận văn tốt nghiệp - 33 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
+ Chỉ có một cấu trúc lấy mẫu 4:2:0.
+ Kích cỡ ảnh tối đa 720 pixel với 576 dòng sử dụng các tham số mặc
định và cỡ 4095 x 4095 dùng tham số đầy đủ.
+ Độ chính xác mẫu đầu vào 8 bit.
+ Độ chính xác lượng tử hoá và DCT: 9 bit.
+ Sử dụng lượng tử hoá DPCM tuyến tính cho hệ số DC.
+ Lượng tử thích nghi cho lớp macroblock (16x16 điểm).
+ Độ chính xác cực đại của hệ số DC là 8 bit.
+ Ma trận lượng tử chỉ có thể thay đổi ở lớp chuỗi.
+ Sử dụng khung P và B.
+ Độ chính xác dự báo chuyển động là nửa điểm.
+ Tốc độ bit tối đa là 1,85 Mbps khi dùng tham số mặc định cho ảnh
720x576 và 100 Mbps khi dùng tham số đầy đủ cho ảnh 4095 x 4095.
MPEG-1 cho phép có sự truy cập ngẫu nhiên các khung video, tìm
kiếm nhanh thuận ngược theo dòng bit đã nén, phát lại ngược dòng video và
khả năng dời bỏ dòng bit nén.
d) Hệ thống nén MPEG-1
Bộ phân loại Inter/Intra căn cứ vào thông tin phân loại ảnh (I, P, B) sẽ cho tín
hiệu ra Inter/Intra xác định ảnh được mã hóa theo mode Inter hay mode Intra. Thông
tin này là tác nhân chuyển mạch kích hoạt bộ tạo dự báo tương ứng.
Nếu ảnh I (mã hóa Intra): Sử dụng dự báo Intra, lấy MB lân cận trước đó
làm dự báo cho MB hiện hành. MB lân cận này được phục hồi nhờ bộ giải lượng
tử và biến đổi DCT ngược (IDCT).
Nếu ảnh B, P (mã hóa Inter): Sử dụng bộ tạo dự báo Inter có bù
chuyển động.
Bộ tạo dự báo này hoạt động như sau:
Chuyển động của các MB được tính toán nhờ bộ ước lượng chuyển động theo
các thuật toán Blocking Matching. Kết quả cho vector chuyển động.
Vector chuyển động này được đưa đến khối dự báo có bù chuyển động để
tạo giá trị dự báo có bù chuyển động.
Do quá trình ước lượng chuyển động cần so sánh giữa khung hiện hành
với khung quá khứ (ảnh P) hoặc với cả khung quá khứ lẫn tương lai (ảnh B) nên
cần có hai bộ lưu trữ ảnh.
Luận văn tốt nghiệp - 34 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Sai số giữa MB dự báo và hiện hành được biến đổi DCT, lượng tử hóa,
mã hóa VLC rồi đưa tới bộ nhớ đệm. Đầu ra bộ nhớ đệm là dòng bit đã được
mã hóa và có tốc độ ổn định.
Tham số lượng tử, thông tin phân loại Inter/Intra và vector chuyển động
sẽ được ghép kênh với thông tin ảnh đưa tới bên thu phục vụ cho quá trình tạo dự
báo và giải mã khôi phục ảnh.
Sơ đồ khối chi tiết bộ codec (bộ mã hoá) trong chuẩn MPEG-1 như sau:
Hình 2.11: Sơ đồ khối bộ mã hóa MPEG-1
Thông tin về loại
ảnh (I,B,P)
Bộ phân loại
Inter_Intra
DCT
Bộ cảm nhận
đặc tính mã
hóa
Mã hóa VLC
và ghép kênh
Bộ nhớ điệm
Lượng tử
hóa
Lượng
tử hóa
thích
Giải lượng
tử
ICDT
Dự báo có
bù chuyển
động
Ước lượng
chuyển
động
Lưu trữ
ảnh tương
lai
Lưu trữ
ảnh quá
khứ
DCT: Biến đổi cosin rời rạc
ICDT: Biến đổi cosin rời rạc ngược
Loại
ảnh
(I,B,P)
Loại
ảnh
(I,B,P)
INTER/
INTRA
Write
Previous
Write
Future
Vecto
chuyển
động
INTER/
INTRA
Tham
số
lượng
tử
Tham
số
lượng
tử
Vecto
chuyển
động
Dòng
video
vào
INTER/
INTRA
Dòng bit
Luận văn tốt nghiệp - 35 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Sơ đồ khối chi tiết bộ giải mã trong chuẩn MPEG-1 như sau:
Hình 2.12: Sơ đồ khối bộ giải mã MPEG-1
Trong dòng bit truyền đi từ bên phát sẽ có thông tin ảnh gốc cũng như các tham
số quy định bước lượng tử và vector chuyển động. Vector chuyển động này được
bên thu sử dụng để tạo dự báo có bù chuyển động tương tự như phía phát.
Giá trị sai số dự báo từ bên thu sau khi giải lượng tử và biến đổi DCT
ngược được cộng với giá trị dự báo. Kết quả thu được ảnh cần hồi phục.
1.3.3 Nén video theo tiêu chuẩn MPEG-2
a) Tiêu chuẩn nén video MPEG-2
Tiêu chuẩn MPEG-2 còn được gọi là ISO/IEC 13818 là sự phát triển tiếp
theo của MPEG-1 ứng dụng cho độ phân giải tiêu chuẩn của truyền hình do CCIR-
601 qui định. MPEG 2 gồm 4 phần:
Phần 1: Hệ thống (ISO/IEC 13818-1): Xác định cấu trúc ghép kênh audio,
video và cung cấp đồng bộ thời gian thực.
Phần 2: Video (ISO/IEC 13828-2): Xác định những thành phần mã hóa đại diện
cho dữ liệu video và phân loại xử lý giải mã để khôi phục lại khung hình ảnh.
Phần 3: Audio (ISO/IEC 13818-3): Mã hóa và giải mã dữ liệu âm thanh.
Phần 4: Biểu diễn (ISO/IEC 13818-4): Định nghĩa quá trình kiểm tra các yêu
cầu của MPEG-2.
Bộ nhớ
đệm
Giải mã
và tách
kênh
Giải lượng
tử hóa
IDCT
Lưu trữ
ảnh tương
lai
Lưu trữ
ảnh quá
khứ Dự báo có
bù chuyển
động
Dòng
video ra
Loại ảnh
(I,B,P)
Loại ảnh
(I,B,P)
Vecto chuyên
động
Tham số lượng tử
Write
Future
Write
Previous
INTER/
INTRA
Dòng bit
Luận văn tốt nghiệp - 36 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
So với MPEG-1, MPEG-2 có nhiều cải thiện, ví dụ về kích thước ảnh và độ
phân giải ảnh, tốc độ bit tối đa, tính phục hồi lỗi, khả năng co giãn dòng bit. Khả
năng co giãn dòng bit của MPEG-2 cho phép khả năng giải mã một phần dòng
bit mã hóa để nhận được ảnh khôi phục có chất lượng tuỳ thuộc mức độ yêu cầu.
Sau đây là một số đặc điểm chủ yếu của tiêu chuẩn này :
Hỗ trợ nhiều dạng thức video, đặc biệt là các dạng thức video độ phân giải
không gian cao, dạng thức video xen kẽ của truyền hình.
Cú pháp dòng bit MPEG-2 là sự mở rộng của dòng bit MPEG-1.
Nén video MPEG-2 tương hợp với nén video MPEG-1. Được thể hiện qua
4 hình thức tương hợp.
+ Tương hợp thuận: Bộ giải mã MPEG-2 có khả năng giải mã dòng bit
(hoặc một phần dòng bit MPEG-1).
+ Tương hợp ngược: Bộ giải mã MPEG-1 có khả năng giải mã được
một phần dòng bit MPEG-2.
+ Tương hợp lên: Bộ giải mã có độ phân giải cao có khả năng giải mã
được dòng bit của bộ mã hoá có độ phân giải thấp.
+ Tương hợp xuống: Bộ giải mã co ù độ phân giải thấp có thể giải mã
được một phần dòng bit của bộ mã hóa độ phân giải cao.
MPEG-2 hỗ trợ khả năng co giãn (scalability): Co giãn không giãn, co giãn
SNR (Signal to Noise Ratio), co giãn phân chia số liệu, ...
Ngoài ra còn có nhiều cải tiến khác trong MPEG-2 bao gồm:
+ Cho phép nhiều cấu trúc lấy mẫu: 4:4:4, 4:2:2 và 4:2:0.
+ Hệ số DC được mã hóa với độ chính xác đặc biệt.
+ Bảng lượng tử riêng biệt cho các thành phần chói và màu nên lợi dụng
được đặc điểm của mắt người ít nhạy cảm hơn với tín hiệu màu.
+ Cho phép cả hai dạng quét: Quét xen kẽ và quét liên tục.
+ Có khả năng hồi phục sữa lỗi.
Cú pháp đầy đủ của MPEG-2 được thể hiện qua các tập con gọi là
profile, phù hợp với các lĩnh vực áp dụng. Mỗi profile lại bao gồm từ 1 đến 4
mức độ hạn chế về độ phân giải không gian, tốc độ bit.
b) Cấu trúc dòng bit video MPEG-2
Dòng bit MPEG-2 về cơ bản tương hợp với MPEG-1, tức là cũng gồm cấu
trúc 6 lớp tên gọi và chức năng các lớp được liệt kê lại như sau:
Luận văn tốt nghiệp - 37 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Lớp Chức năng
Lớp chuỗi (Sequence Layer) Đơn vị nội dung
Lớp nhóm ảnh (GOP Layer) Đơn vị truy nhập ngẫu nhiên
dòng video mã hóa.
Lớp ảnh (Picture Layer) Đơn vị mã hóa cơ bản
Lớp lát (Slice Layer) Đơn vị tái đồng bộ
Lớp Macro Block (MB Layer) Đơn vị bù chuyển động
Lớp khối (Block Layer) Đơn vị chuyển đổi DCT
Bảng 2.3: Các lớp của cú pháp dòng bit MPEG-2
Lớp chuỗi là đại diện mã hóa cho một chuỗi ảnh (Video sequence).
Lớp nhóm ảnh cung cấp điểm truy cập ngẫu nhiên. Ảnh bắt đầu của chuỗi bao
giờ cũng là một ảnh I. Ảnh I này cung cấp điểm truy cập vào dòng bit mã hóa.
Lớp lát có chức năng hồi phục đồng bộ. Khi dòng bit có lỗi, bộ giải mã có thể
bỏ qua slice có lỗi và bắt đầu bằng một slice mới. Mỗi lát chứa một hoặc một số MB.
Mỗi macroblock (MB) là một đơn vị được ước lượng chuyển động và
có vector chuyển động riêng trong phần header của nó.
Lớp khối là lớp thấp nhất. Mỗi khối là một đơn vị DCT gồm 64 hệ số
(một hệ số DC và 63 hệ số AC phép chuyển đổi cosine rời rạc) của khối ảnh I
hoặc khối sai số dự báo (ảnh P, B).
So với MPEG-1, cú pháp dòng bit MPEG-2 có thêm một số chức năng mở rộng.
Do đó có 2 hướng đi trong dòng bit MPEG-2 như hình vẽ dưới đây: hoặc theo quy
trình MPEG-1 hoặc theo các chức năng mở rộng riêng của MPEG-2.
Hình 2.13: Cú pháp dòng bit MPEG-2
c) Khả năng co giản của MPEG-2
Một trong những đặc điểm quan trọng nhất của MPEG-2 là sự phù hợp với
nhiều ứng dụng video. Có thể sử dụng MPEG-2 cho phân phối truyền hình tiêu
chuẩn (Standard Television), truyền hình phân giải cao (High Definition Television)
hoặc cho truyền dẫn tín hiệu truyền hình thông qua các mạng truyền thông.
Sequence headend
(đầu đề chuỗi) Dòng bit
MPEG-1
ISO/IEC 11172-2
xtended Sequence
(chuỗi mở rộng)
Luận văn tốt nghiệp - 38 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Tính co giãn của dòng bit MPEG-2 là khả năng giải mã được một phần dòng bit
MPEG-2 độc lập với phần còn lại của dòng bit đó nhằm khôi phục video với chất lượng
hạn chế (hạn chế độ phân giải không gian, độ phân giải thời gian hoặc hạn chế về
SNR...). Dựa theo tính co giãn, dòng bit được phân thành hai hay nhiều lớp. Tập con nhỏ
nhất của cú pháp dòng bit có thể giải mã một cách độc lập được gọi là lớp cơ bản. Các
lớp còn lại được gọi là các lớp nâng cao. Có nhiều loại co giãn khác nhau như:
Co giãn không gian: Dòng bit gồm hai hay nhiều lớp video có độ phân
giải không gian khác nhau.
Co giãn SNR: Dòng bit gồm hai hay nhiều lớp video có cùng độ phân
giải không gian nhưng tỉ số tín hiệu trên nhiễu SNR là khác nhau.
Co giãn thời gian: Dòng bit gồm hai hay nhiều lớp video có cùng độ phân
giải không gian nhưng có độ phân giải thời gian khác nhau.
Co giãn phân chia số liệu: Dòng bit video được chia làm hai phần. Phần
ưu tiên cao (lớp cơ bản) gồm các hệ số DCT tần số thấp, phần ưu tiên thấp
(lớp nâng cao) gồm các hệ số DCT tần số cao.
Co giãn phân chia số liệu chính là một dạng cơ bản của co giãn tần số. Tiêu
chuẩn MPEG-2 đã qui định chính thức hai loại co giãn: co giãn không gian và co
giãn SNR. Các loại co giãn khác chỉ mới ở dạng dự thảo.
d) Profile và Level của MPEG-2
Phạm vi ứng dụng của MPEG-2 rất rộng. Mỗi ứng dụng đòi hỏi mức độ phức tạp
khác nhau. Bởi vậy, MPEG-2 định nghĩa các mức (level) và các tập con
(profile) phù hợp cho từng lĩnh vực áp dụng. Profile xác định cú pháp dòng bit và level
xác định các tham số hạn chế độ phân giải không gian, tốc độ bit.
Có 4 mức: low (thấp), main (chính), high-1440 (cao-1440) và high (cao).
Kích cỡ ảnh quy định bởi 4 mức tương ứng sau:
Level Cỡ khung
Low 352x288 (bằng 1/4 cỡ ảnh SDTV)
Main 720x576 (cỡ chuẩn SDTV)
High-1440 1440x1152 (cỡ HDTV)
High 960x576 hoặc 1920x1152
Bảng 2.4: Mức ảnh trong MPEG-2
Có 5 profile là: Simple (đơn giản), Main (chính), SNR scalable (co giãn
SNR), Spatial scalable (có khả năng co giãn không gian) và High profile.
Tổng cộng có 12 tổ hợp profile, level. Trong đó:
Luận văn tốt nghiệp - 39 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
MP @ ML (Main profile @ Main level):
Lấy mẫu 4:2:0
Độ phân giải: 720*576
Tốc độ bit: 15Mbps
Dạng ảnh: I, P, B
Ứng dụng vào việc số hóa truyền hình tiêu chuẩn (Standard television).
MP @ HL (Main profile @ High level):
Lấy mẫu 4:2:0
Độ phân giải: 1920x1152
Tốc độ bit: 80Mbps
Dạng ảnh sử dụng: I, P, B
Ứng dụng vào HDTV (truyền hình số có độ phân giải cao).
Sau này có bổ sung 4:2:2 P @ ML (4:2:2 Profile @ Main level) áp dụng
vào lĩnh vực sản xuất chương trình truyền hình (studio) vì các lý do sau:
+ Chất lượng cao: Độ phân giải màu tốt hơn so với MP @ ML (lấy mẫu
4:2:0), chất lượng tổng quát cao hơn do sử dụng tốc độ bit lớn hơn.
+ Có khả năng sao chép nhiều lần mà vẫn đảm bảo chất lượng y như video gốc.
+ Tính linh hoạt: Nhóm anh (GOP) ngắn hơn nên thuận tiện cho việc dàn
dựng, biên tập chương trình truyền hình.
+ Tính kinh tế: Giá thành lưu trữ và truyền dẫn giảm, có khả năng tương
hợp giữa các thiết bị của nhiều hãng sản xuất khác nhau.
Các tham số cơ bản của 4:2:2 P @ ML:
Cấu trúc lấy mẫu: 4:2:2
Độ phân giải ảnh: 720*576
Tốc độ dòng bit: 20Mbps
Dạng ảnh sử dụng: I, P, B
2. Công nghệ ghép kênh
Ngày nay, việc sử dụng phổ tần số ngày càng được chú trọng. Vì phổ tần số là
tài sản hữu hạn của quốc gia phục vụ nhiệm vụ thông tin liên lạc ngày càng phát
triển không ngừng của xã hội, cũng như phục vụ cho việc phát triển kinh tế xã hội,
an ninh quốc phòng. Việc sử dụng tần số một cách tiết kiệm và có hiệu quả là ưu
tiên hàng đầu. Ghép kênh là ghép nhiều luồng tín hiệu lại với nhau thành một
luồng duy nhất, nhằm tiết kiệm kênh truyền. Có hai phương pháp ghép kênh số:
Luận văn tốt nghiệp - 40 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Ghép kênh phân chia theo thời gian (TDM - Time Division Multilexing
Method). Về nguyên lý TDM gán các khe thời gian một cách tuần hoàn cho các
dòng sơ cấp audio, video và số liệu.
Hình 2.14: Ghép kênh theo thời gian
Ghép kênh gói (Packet Multiplexing Method). Trong cách ghép kênh gói, các gói
số liệu từ các dòng sơ cấp audio, video, số liệu được đan xen vào nhau một cách tuần hoàn
hoặc không tuần hoàn, gói này tiếp theo gói kia để hình thành một dòng ghép kênh.
Hình 2.15: Ghép kênh gói
2.1 Hệ thống ghép kênh video số theo tiêu chuẩn MPEG-2
2.1.1 Ghép kênh gói theo chuẩn MPEG
Hình 2.16: Bộ ghép kênh MPEG-2
Hệ thống ghép kênh gói mô tả cách thức các dòng số video nén, audio nén và các
dòng số liệu khác được ghép chung lại với nhau để tạo ra dòng ghép kênh MPEG. Một
số thuật ngữ và các nguyên lý cơ bản của các lớp hệ thống MPEG:
V4 V3 V2 V1
A4
A3
A1
D4
D2
D1
A3
V3
D2
V2
D1
A1
V1
Framer
TS3 TS2 TS1
MULTIPLEXER
Dòng sơ cấp chương trình #1
Dòng sơ cấp chương trình #2
Dòng sơ cấp chương trình #n
Số liệu riêng
Thông tin dịch vụ
Điều kiển truy cập
có điều kiện
Dòng ghép kênh
MPEG-2
BỘ
GHÉP
KÊNH
MPEG-2
V3 V2 V1
A3
A2 A1
D3
D2
D1
Framer
MULTIPLEXER
V1
A1
D1
V2 A2 D2
V3 A3
D3
Luận văn tốt nghiệp - 41 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Chương trình (Program): Theo ngôn ngữ phát thanh truyền hình thì chương
trình thường có nghĩa là các tiết mục thông tin, giáo dục, giải trí, … được các đài
phát lên sóng hàng ngày. Trong ngữ nghĩa của MPEG, thuật ngữ chương trình có
nghĩa là một kênh (channel) hay một dịch vụ phát sóng (broadcast service) đơn.
Theo nghĩa này thì VTV1, VTV2, HTV7, … là các chương trình.
Dòng sơ cấp ES (Elementary Stream): Một chương trình bao gồm một hay
nhiều dòng sơ cấp. Chương trình truyền hình thông thường bao gồm ba dòng sơ cấp
đó là: dòng video, dòng audio và dòng số liệu teletex.
Dòng ghép kênh: Lớp hệ thống MPEG-2 mô tả cách thức các dòng sơ cấp
của một chương trình hay của nhiều chương trình được ghép chung với nhau tạo
thành một dòng số liệu thích hợp cho lưu trữ số, hay truyền dẫn số.
Các thông tin cần thiết khác:
+ Hệ thống các nhãn thời gian (Tim Stamp - TS): Sử dụng để đảm bảo các
dòng sơ cấp liên hệ với nhau được phát lại một cách đồng bộ tại bộ giải mã.
+ Các bảng thông tin dịch vụ (Service Imformation): Mô tả chi tiết về thông số
mạng, về các chương trình được ghép kênh và về bản chất của các dòng sơ cấp khác nhau.
+ Các thông tin điều kiển việc xáo trộn (Scrambling) số liệu, các thông tin
dùng để truy cập có điều kiện CA (Conditional Access).
+ Các kênh số liệu riêng (Private Data): Số liệu riêng là dòng số liệu mà
nội dung của nó không được quy định bởi chuẩn MPEG.
+ Ở MPEG, để đạt được sự đồng bộ thông qua việc sử dụng nhãn thời gian
tần số và chuẩn đồng hồ (Clock System CS). CS là mẫu data 33 bit chỉ báo thời
gian theo đồng hồ thời gian hệ thống (System Time Clock STC) của một đơn vị
trình diễn (Presentation Unit PU: ảnh, video, audio, …) nào đó.
2.1.2 Hệ thống ghép kênh MPEG-2
Hình 2.17: Hệ thống ghép kênh MPEG-2
Mã hoá
video
Mã hoá
audio
Đóng gói
Đóng gói
Ghép
kênh
dòng
chương
trình
Ghép
kênh
dòng
truyền
tải
Video
vào
Audio
vào
Dữ liệu
Dòng chương
trình
Dòng truyền
tải
Luận văn tốt nghiệp - 42 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Hệ thống ghép kênh MPEG-2 được chia thành 2 hệ thống: Hệ thống ghép
kênh dòng chương trình và hệ thống ghép kênh dòng truyền tải.
Bộ mã hóa video mã hóa tín hiệu video số định dạng CCIR-601 thành dòng sơ
cấp video (video ES) có chiều dài gần như vô tận và chỉ chứa thông tin tối cần thiết
để có thể khôi phục lại hình ảnh ban đầu.
Bộ mã hóa audio mã hóa tín hiệu audio số định dạng AES/EBU thành dòng sơ
cấp audio có chiều dài tùy ý (tần số lấy mẫu 48KHz, lượng tử hóa 24 bit và tốc độ
bit là 1152Kbps).
Để có thể truyền được với tốc độ cao, các dòng video, audio được đóng gói lại
thành các dòng sơ cấp PES (Packetized Elementary Stream) tương ứng với các gói
có độ dài thay đổi. Mỗi gói PES bao gồm một header và một số liệu trích ra từ
dòng sơ cấp. Các gói PES lại được ghép với nhau tạo ra dòng chương trình (PS -
Program Stream) hay dòng truyền tải (TS - Transport Stream).
Hình 2.18: Hệ thống cấu trúc các lớp MPEG
Trong hệ thống MPEG-2 có 2 lớp:
Lớp nén: Mô tả cú pháp của dòng video và audio dựa trên cấu trúc dòng data
video và audio (đã trình bày trong phần trước). Các chuỗi data video và audio độc
lập được mã hóa MPEG-2 để tạo ra các dòng độc lập gọi là dòng cơ bản.
Lớp hệ thống: Định nghĩa tổ hợp của các dòng bit audio và video riêng biệt
thành một dòng đơn để lưu trữ (dòng chương trình PS) hay để truyền tải (dòng
truyền tài TS). Hệ còn gồm các thông tin định thời và thông tin khác cần cho giải
đa hợp dòng audio, video và để đồng bộ audio-video ở phía giải mã; thông tin
chuẩn đồng hồ hệ thống (System Clock Reference - SCR) và nhãn thời gian trình
diễn (Presentation Time Stamp - PTS) được chèn vào dòng bit MPEG.
Định dạng nguồn
Mã hoá nén
Đóng gói
Đa hợp dòng TS
Đa hợp dòng
PS
Giải định dạng nguồn
Giải mã nén
Mỡ gói
Giải đa hợp dòng TS
Giải mã đa
hợp dòng PS
Lớp nén
Lớp hệ
thống
Tín hiệu video, audio, dữ liệu
Luận văn tốt nghiệp - 43 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Chuẩn MPEG định nghĩa một hệ thống ba dòng data có thứ bậc như sau: dòng
sơ cấp đã đóng gói, dòng chương trình và dòng truyền tải.
Dòng sơ cấp đóng gói (PES): Qua bộ đóng gói, dòng sơ cấp được chia thành
các gói có độ dài tùy ý. Nội dung gói có nguồn gốc từ dòng data hay dòng audio
hay dòng video đã được mã hóa MPEG-2.
Hình 2.19: Cấu trúc PES
Dòng chương trình (PS - Program Stream): Các gói PES có nguồn gốc từ
1 hay nhiều dòng sơ cấp dùng chung gốc thời gian như là dòng audio, video, data,
được ghép thành một dòng chương trình PS như các lô (pack) có tính lặp lại. Trong
phần header của lô, SCR đảm bảo các gói audio và video được định thời. Đó là tín
hiệu thời gian thực chỉ báo thời gian truyền trong lo đó. Các lô PS có độ dài tùy ý.
Số lượng và trình tự các gói trong lô không được định nghĩa, nhưng các gói được
gởi theo trình tự thời gian. Một PS có thể mang tới 32 dòng audio, 16 dòng video,
16 dòng data; tất cả đều có chung gốc thời gian. PS nhạy với lỗi và được dùng ghi
hình đa phương tiện và phân phối nội bộ, trong các ứng dụng có sai số truyền có
thể bỏ qua được.
Dòng truyền tải (TS - Transport Stream): Có thể được tạo thành từ một tổ
hợp 1 hay nhiều dòng PS có gốc thời gian độc lập nhau hoặc từ một tổ hợp các
PES. Tuy nhiên, PS không phải là một bộ con của TS, do TS không chứa tất cả
thông tin trên thì các gói PES có nguồn gốc từ một hay nhiều dòng sơ cấp ES dùng
chung gốc thời gian hay gốc thời gian khác nhau như dòng audio, video và data
được ghép hợp thành một dòng truyền tải TS gồm các gói truyền tải có kích cỡ nhỏ
mang tính lặp lại. Một hay nhiều PS có clock chuẩn khác nhau cũng có thể được
ghép hợp thành một TS qua sự chuyển đổi trong gói PES. Các gói TS có chiều dài
cố định 188 byte và nội dung data của chúng. Chúng mang thông tin định thời,
thông tin đồng bộ và cơ chế sữa jitter để bảo đảm truyền tải khoảng cách xa tin cậy
được. Hơn nữa, kích cỡ gói data cố định cho phép chuyển đổi TS thành các tế bào
mạng ATM (Asynchronous Tranfer Mode). Dòng này có sức đề kháng với lỗi nên
được chỉ định cho các ứng dụng có sai số không thể bỏ qua được.
8 byte Phần payload ES (lớn nhất 8x210 – 8 = 8184 byte)
SC SC SC SI PL BS BS PL
Tên Số byte Mục đích
SC 3 Mã bắt đầu
SI 1 Nhận dạng dòng
PL 2 Độ dài gói
BS 2 Kích cỡ bộ đệm
Luận văn tốt nghiệp - 44 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Hình 2.20: Cấu trúc gói dòng truyền tải TS
Hình 2.21: Định dạng dòng truyền tải MPEG-2
Dòng sơ cấp
video
Dòng
truyền tải
đa chương
trình
Chuỗi Audio # n-1
Chuỗi Audio # n
Chuỗi Audio #
n+1
Video
Audio Video
Video
Audio Video Audio2
Audio1 Dư liệu
Video
Audio
Chuỗi Video # n-1 Chuỗi Video # n Chuỗi Video # n+1
Gói PES (độ dài thay đổi, lớn hơn 64 Kbit)
188 byte
Dòng chương
trình #1
Dòng chương
trình #2
Dòng chương
trình #3
Gói PES (độ dài thay đổi, lớn hơn 64 Kbit)
188 byte/gói
Dòng sơ cấp
video đã
đóng gói
Các gói
truyền tải
video
Dòng sơ cấp
audio
Dòng sơ cấp
audio đã
đóng gói
Các gói
truyền tải
audio 1
188 byte/gói
Số liệu truyền tải
1 byte 3 byte điều kiển
4 byte 184 byte
Gói có độ dài 188 byte
Phần
header
của gói
TS Phần header thích
nghi có độ dài thay đổi Byte
đồng bộ
Luận văn tốt nghiệp - 45 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
2.1.3 Ghép kênh dòng chương trình (Program Stream Mux)
Một dòng chương trình là kết quả ghép kênh một vài dòng cơ sở đóng gói sử
dụng cùng một hệ thống xung nhịp thời gian. Chương trình có thể là một dòng
video có kèm audio hoặc một chương trình nhiều kênh audio.
Hình 2.22: Ghép kênh dòng chương trình PS
Dòng video cơ sở được chia thành các đơn vị truy cập (AU-Access Units). Mỗi
AU chứa dữ liệu đã được nén của một ảnh. Các ảnh này được phận biệt bởi ảnh I, P
hoặc B. Mỗi video AU là một gói chương trình (Program Stream Packet), các gói này
thay đổi về kích thước. Ví dụ gói ảnh I lớn hơn nhiều gói ảnh B. Tuy nhiên đối với
các đơn vị truy cập audio số (DAA-Digital Audio Access) thường có cùng kích thước
và vài DAA tạo thành một gói dòng chương trình.
Hình 2.23: Dòng chương trình
Dòng chương trình được thiết kế để truyền trong môi trường không có tạp nhiễu
và sai nhầm, ví dụ như trong các ứng dụng CD – ROM vì 2 nguyên nhân sau:
Dòng chương trình bao gồm các gói tương đối dài nối tiếp nhau và độ dài
này lại luôn thay đổi. Mỗi gói bắt đầu bằng một tiêu đề (header). Mỗi lỗi xảy ra
trong phần tiêu đề có thể làm mất thông tin của toàn gói vì các gói của chương
trình có thể chứa vài chục Kbyte số liệu nên sự mất mát thông tin của một gói có
thể làm mất hoạt gián đoạn cả một khung ảnh.
Độ dài gói không cố định khiến cho bộ giải mã không dự đoán được khi nào gói
chấm dứt và khi nào gói mới bắt đầu. Thay vào đó, bộ giải mã đọc và dịch lại toàn bộ
thông tin về độ dài gói chứa trong mỗi tiêu đề, nếu thông tin về độ dài gói này bị lỗi,
bộ giải mã sẽ mất đồng bộ và như vậy sẽ làm mất thông tin ít nhất là một gói.
Vì môi trường truyền dẫn phát sóng mà chúng ta quan tâm luôn có tạp nhiễu
và sai nhầm, do đó không thể dùng dòng chương trình được mà phải dùng dòng
truyền tải.
Audio Video Audio
Gói PES
PES header
Program
stream
MUX
Video PES
Audio PES
Program stream (PS)
Luận văn tốt nghiệp - 46 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
2.1.4 Ghép kênh dòng truyền tải (Tranpost Stream Mux)
Hình 2.24: Dòng truyền tải
Nếu chia các gói PES có độ dài khác nhau thành các gói TS có độ dài không
đổi (thường có chiều dài 188 byte) và truyền các gói này đi sau khi đã cộng với
dòng bit điều khiển dùng để mô tả chương trình.
Hình 2.25: Ghép kênh dòng truyền tải
Trong dòng truyền tải, các gói PES từ các dòng sơ cấp khác nhau được phân nhỏ
và gán vào phần payload của gói tần số. Quy trình này phải thỏa mãn 2 điều kiện:
Byte đầu tiên của mỗi gói PES phải trở thành byte đầu tiên của payload của gói TS.
Bất kỳ gói TS nào cũng chỉ mang phần dữ liệu lấy từ cùng một gói PES.
Mỗi gói PES không thể phân chia dữ liệu của nó một cách chính xác vào một
số nguyên gói TS. Thường gặp trường hợp không đủ số liệu để lắp đầy vào payload
của gói TS cuối cùng. Để thỏa mãn 2 điều kiện trên, người ta độn thêm vào phần
adaptaion field với độ dài thích hợp. Có thể giảm tối thiểu độ dài phần adaptaion
field này bằng cách lựa chọn chiều dài gói PES hợp lý. Gói PES cũng thường được
chọn đủ dài để đa số các gói TS được lắp đầy bởi số liệu có ích lấy từ các gói PES.
Tất cả các gói sơ cấp PES ghép kênh chung với nhau tạo nên 1 hay nhiều chương
trình sẽ được chuyển thành các gói TS theo cùng một cách thức như trên. Các gói TS
sẽ được sắp xếp từng tự tạo ra dòng truyền tải. Các gói TS chứa thông tin dịch vụ cũng
như các gói TS rỗng được sử dụng để lắp đầy kênh truyền. Thứ tự các gói TS có thể
sắp xếp tùy ý miễn sao đảm bảo được điều kiện các gói TS của cùng một dòng sơ cấp
đóng gói PES sẽ được truyền theo thứ tự thời gian.
Audio
Gói TS
PES header
Video Audio Video Audio Video
PES header
PID 1
Dòng truyền tải
GHÉP
KÊNH
DÒNG
TRUYỀN
TẢI
PID 2
PID (n -3)
PID (n -2)
PID (n -1)
PID (n)
Video PES
Video PES
Audio PES
Audio PES
Data
Dòng ánh
xạ cơ sở
Luận văn tốt nghiệp - 47 -
Thiết kế headend SD, HD
GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận
Hình 2.26: Chia các gói PES thành các gói TS
a) Cấu trúc dòng truyền tải
Hình 2.27: Cấu trúc gói truyền tải
Gói truyền tải có kích thước cố định và bằng 188 byte, chia thành dữ liệu tiêu
đề (header) và dữ liệu có ích (payload). Dữ liệu tiêu đề có độ dài tối thiểu bằng 4
byte chứa các thông tin sau:
Sync byte (8 bit): Byte đồng bộ mang giá trị không đổi bằng 0x47 không
phải là giá trị duy nhất trong gói TS và có thể xuất hiện trong các trường của gói
TS. Tuy nhiên, hiện tượng sync byte lặp đi lặp lại 188 Kbyte cùng với giá trị 0x47
của nó sẽ tạo cơ sở để nhận dạng chỗ bắt đầu của một gói TS mới.
Transpost error indication (1 bit): Bit này dùng để báo hiệu có lỗi gói xảy
ra trên đường truyền – khi tỉ lệ sai nhầm bit (BER –Bit Error Rate) vượt quá giá trị
cho phép từ khâu điều chế đến khâu giải điều chế, phân kênh. Giá trị 1 chỉ thị rằng
đang có lỗi không thể sửa chữa được trong gói TS hiện hành, vì vậy không nên sử
dụng phần payload trong gói TS này.
Header Payload Header Payload Header Payload ……
Sync
byte
(8 byte)
Transport
error
indicator
(1 bit)
Start
indicator
(1 bit)
Transport
priority
(1 bit)
PIP
(13 bit)
Scrambling
contro
(2 bit)
Adaptation
field
control
(2 bit)
Continuity
counter
(4 bit)
Adaptati
-on field
Payload
(n1 byte)
Discontinuity
indicator
(1 byte)
Random
access
indicator
(1 bit)
5 flags
(1 bit)
Optional
Field
(1 bit)
Stuffing
byte
(n2 )
Adaptation
field
lenghth
(8 bit)
OPCR
(42 bit)
Splice
countdown
(8 bit)
Transport
private data
(8+n3)
Adaptation
field
extension
(8 + n4)
PCR
(42 bit)
188 byte
Adaptation
field
Payload PES
Header
Các file đính kèm theo tài liệu này:
- luan_van_tot_nghiep.pdf