Luận văn Thiết kế headend SD, HD - Tài liệu, Luận văn

Tài liệu Luận văn Thiết kế headend SD, HD: Luận văn tốt nghiệp - 1 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Chương 1: Tổng quan về truyền hình và chuẩn MPEG 1. Lịch sử truyền hình Truyền hình, hay còn được gọi là báo hình, là một loại phương tiện thông tin đại chúng hiện đại, không thể thiếu của một quốc gia. Nó là một phương tiện hiệu quả nhất trong truyền bá thông tin, phục vụ tốt nhiệm vụ chính trị, kinh tế, xã hội, … của một địa phương hay một quốc gia, phát triển mạnh mẽ trên quy mô toàn cầu, là loại thông tin đến được nhiều người nhất. Truyền hình là loại hình báo chí truyền tải nội dung chủ yếu bằng hình ảnh sống động và các phương tiện biểu đạt khác như lời nói, chữ viết, hình ảnh, âm thanh, ... truyền hình chính là ngành công nghiệp được phát triển trên cơ sở các tiến bộ về công nghệ, thiết bị thu, phát, truyền dẫn, trường quay. 1.1 Quá tr...

112 trang | Chia sẻ: hunglv | Lượt xem: 1219 | Lượt tải: 2

Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Thiết kế headend SD, HD, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Luận văn tốt nghiệp - 1 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Chương 1: Tổng quan về truyền hình và chuẩn MPEG 1. Lịch sử truyền hình Truyền hình, hay còn được gọi là báo hình, là một loại phương tiện thông tin đại chúng hiện đại, không thể thiếu của một quốc gia. Nó là một phương tiện hiệu quả nhất trong truyền bá thông tin, phục vụ tốt nhiệm vụ chính trị, kinh tế, xã hội, … của một địa phương hay một quốc gia, phát triển mạnh mẽ trên quy mô toàn cầu, là loại thông tin đến được nhiều người nhất. Truyền hình là loại hình báo chí truyền tải nội dung chủ yếu bằng hình ảnh sống động và các phương tiện biểu đạt khác như lời nói, chữ viết, hình ảnh, âm thanh, ... truyền hình chính là ngành công nghiệp được phát triển trên cơ sở các tiến bộ về công nghệ, thiết bị thu, phát, truyền dẫn, trường quay. 1.1 Quá trình phát triển của truyền hình Truyền hình ra đời trong nửa đầu thế kỷ XX, sau khi có sự ra đời của tivi, các thiết bị truyền dẫn, phát sóng và các tiến bộ về công nghệ. Sau nhiều tiến bộ khác nhau, năm 1923, kỹ sư người Scotland, ông John Logie Baird đã đăng ký phát minh ra chiếc máy có khả năng hiện hình ảnh nhận từ những tín hiệu điện từ mà sau này chúng ta gọi là vô tuyến truyền hình (tivi). Từ khoảng năm 1932, hãng BBC của Anh bắt đầu phát các chương trình truyền hình thường kỳ. Ngày nay, sóng truyền hình có thể đạt tới mọi nơi trên trái đất qua trạm chuyển tiếp, cáp truyền hình, vệ tinh nhân tạo và internet. Các chương trình truyền hình, từ chỗ chỉ phát bản tin thô sơ, đã tiến bộ dần với việc cho ra đời hàng trăm loại hình chương trình như các game show, truyền hình thực tế, phỏng vấn truyền hình, truyền hình theo yêu cầu, ... Nhờ sự phát triển của khoa học kỹ thuật, mà công nghệ truyền hình ngày càng hoàn thiện về mặt kỹ thuật cũng như mặt sản xuất chương trình, từ lúc mới ra đời chỉ là truyền hình analog đen trắng dần phát triển lên truyền hình màu, rồi truyền hình số SDTV (truyền hình độ nét chuẩn) và HDTV (truyền hình độ nét cao). 1.2 Các thế hệ truyền hình Từ lúc ra đời cho đến nay công nghệ truyền hình phát triển một cách vượt bậc giữ một vị trí quan trọng trong các lĩnh vực như: giải trí, kinh doanh, chính trị, thông tin, … có nhiều cách phân chia các thế hệ truyền hình, nếu dựa vào công nghệ phát hình thì có thể chia ra hai công nghệ truyền hình đó là công nghệ số và analog. Còn nếu dựa vào công nghệ sản xuất tivi thì ta có thể chia thành các loại như công nghệ Luận văn tốt nghiệp - 2 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận CRT, công nghệ LCD, công nghệ Plasma, công nghệ OLED, … còn dựa vào màu sắc của hình ảnh thì phân ra hai loại là truyền hình đen trắng và truyền hình màu, còn dựa vào môi trường truyền thì chia làm hai loại là truyền hình vô tuyến và truyền hình hữu tuyến. Ở đây chúng ta sẽ tìm hiểu kỹ hơn về hai loại công nghệ này. 1.2.1 Truyền hình vô tuyến Truyền hình vô tuyến là công nghệ truyền hình được sử dụng rộng rãi từ lâu và vẫn tồn tại cho đến ngày nay, với ưu điểm là có vùng phủ sóng rộng, có thể phủ sóng một vùng lãnh thổ rộng lớn (tỉnh, thành phố, quốc gia, …) nhờ các trạm trung chuyển. Nó sử dụng sóng điện từ RF để truyền tín hiệu truyền hình (hình ảnh, âm thanh, …) từ đài phát đến máy thu (tivi) nhờ môi trường không khí. Truyền hình vô tuyến được phân ra làm nhiều loại nhưng có hai loại quan trọng nhất được sử dụng rộng rãi là truyền hình mặt đất và truyền hình vệ tinh. Truyền hình vô tuyến chịu nhiều can nhiễu của môi trường và thời tiết như mưa, sấm sét, các vật cản, … a) Truyền hình mặt đất Truyền hình mặt đất được sử dụng để phát sóng trên một vùng lãnh thổ tương đối rộng lớn (một tỉnh, thành phố, một khu vực, một quốc gia), lợi dụng sự phản xạ của tầng điện li đối với sóng RF băng tần VHF và UHF để truyền hính hiệu đi xa. Máy thu (tivi) thu tín hiệu từ các đài phát hay từ các trạm thu phát trung gian nhờ anten thu (chủ yếu là anten yagi). Tần số phát của truyền hình mặt đất chủ yếu sử dụng băng tần VHF có dải tần từ 30 MHz ÷ 300 MHz và băng tần UHF có dải tần từ 300 MHz ÷ 1000 MHz Tín hiệu được điều chế bằng phương pháp điều chế của truyền hình vệ tinh COFDM nhưng phát xuống mặt đất. b) Truyền hình vệ tinh Truyền hình vệ tinh được sử dụng để phát sóng trên vùng lãnh thổ rất rộng lớn (một quốc gia, một châu lục, toàn cầu), lợi dụng sự truyền thẳng của tần số siêu cao tần qua tầng khí quyển để truyền tín hiệu từ mặt đất đến vệ tinh và từ vệ tinh xuống mặt đất sử dụng mode truyền bất đồng bộ (ATM-Asynchronous Transfer Mode). Máy thu (tivi) thu tín hiệu truyền hình trực tiếp từ vệ tinh thông qua anten parabol, tần số thu phát của truyền hình vệ tinh chủ yếu sử dụng băng C có dải tần từ 3 GHz – 4 GHz và băng Ku có dải tần từ 10 GHz – 12 GHz. Tín hiệu được điều chế bằng phương pháp điều chế COFDM. Luận văn tốt nghiệp - 3 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận 1.2.2 Truyền hình hữu tuyến Khác với truyền hình vô tuyến, truyền hình hữu tuyến chủ yếu sử dụng dây cáp để đưa tín hiệu từ đài phát đến máy thu (tivi). Cáp được sử dụng ở đây là cáp quang và cáp đồng trục. Do tín hiệu được truyền trực tiếp từ đài phát đến máy thu thông qua dây cáp nên tín hiệu ít bị ảnh hưởng bởi môi trường bên ngoài. Vì thế tín hiệu thu được tương đối tốt, chất lượng tương đối cao. Tín hiệu số truyền trong cáp chủ yếu sử dụng các mode điều chế QAM (như: 16-QAM, 32-QAM, 64-QAM, 128-QAM, 256-QAM). Sử dụng mode càng cao thì truyền được nhiều chương trình nhưng dễ ảnh hưởng bởi nhiễu. 2. Quá trình hình thành và phát triển truyền hình cáp Việt Nam 2.1 Quá trình hình thành Với sự phát triển về kinh tế xã hội làm cho cuộc sống người dân đang ngày càng cải thiện và tăng cao. Nhu cầu thụ hưởng các dịch vụ cao cấp cũng tăng theo. Trong đó có nhu cầu về truyền hình – “món ăn tinh thần” không thể thiếu của mọi người dân. Từ cách thức xem truyền hình thụ động, người dân muốn mình chủ động hơn về chương trình truyền hình. Đứng trước những nhu cầu đó truyền hình tương tác ra đời mà đi tiên phong là lĩnh vực truyền hình cáp. Dịch vụ truyền hình cáp ra đời phục vụ nhu cầu thông tin giải trí ngày càng tăng cao của người dân, mà lĩnh vực truyền hình thông thường không đáp ứng được (như số lượng kênh nhiều, có kênh nước ngoài, có kênh chuyên biệt, không có quảng cáo, chất lượng chương trình tốt, ổn định, …). Dịch vụ truyền hình cáp Việt Nam hình thành từ những năm cuối của thập niên 90 và phát triển mạnh mẽ vào các năm gần đây. Đặc biệt là ở hai thành phố lớn là Hồ Chí Minh và Hà Nội, như trung tâm Dịch vụ Truyền hình cáp của đài Truyền hình Việt Nam VCTV ra đời vào năm 1996 trên cơ sở của trung tâm dịch vụ truyền hình MMDS, hay trung tâm Truyền hình cáp của đài Truyền hình thành phố Hồ Chí Minh HTVC ra đời năm 2003. Từ lúc ra đời truyền hình cáp sử dụng công nghệ analog hiện nay đang dần chuyển sang số và sắp tới là phát chương trình HD. 2.2 Các nhà cung cấp dịch vụ truyền hình cáp hiện nay Hiện nay, ở Việt Nam dịch vụ truyền hình cáp phục vụ chủ yếu ở Hà Nội và thành phố Hồ Chí Minh và càng ngày được mở rộng ra các vùng lân cận chủ yếu là khu vực đô thị, dân cư đông đúc. Có ba nhà cung cấp dịch vụ truyền hình cáp chính: Luận văn tốt nghiệp - 4 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận  Trung tâm Dịch vụ Truyền hình cáp của đài Truyền hình thành phố Hồ Chí Minh HTVC, hiện phát khoảng 67 kênh truyền hình trong và ngoài nước.  Trung tâm Dịch vụ Truyền hình cáp của đài Truyền hình Việt Nam VCTV, hiện nay phát khoảng 54 kênh truyền hình trong và ngoài nước.  Công ty Truyền hình cáp SaigonTourist SCTV là doanh nghiệp nhà nước liên doanh giữa đài Truyền hình Việt Nam và tổng công ty Du lịch Sài Gòn, hiện nay phát khoảng 72 kênh truyền hình trong và ngoài nước. Dịch vụ truyền hình cáp từ lúc ra đời cho đến nay đã có những bước phát triển không ngừng. Với ưu thế của mình truyền hình cáp sẽ cạnh tranh quyết liệt với các loại truyền hình khác để mở rộng và phát triển thị phần. 2.3 Lợi ích của dịch vụ truyền hình cáp Dịch vụ truyền hình cáp ra đời mang lại bước đột phá mới trong công nghệ truyền hình, làm thay đổi quan niệm về lĩnh vực truyền hình (truyền hình bây giờ không còn là truyền hình miễn phí mà là truyền hình có thu phí). Truyền hình không đơn thuần là giải trí, xem tin tức như thông thường nữa mà nó còn tích hợp nhiều tính năng khác nữa như: VoD -Video on Deman-truyền hình theo yêu cầu, internet, mua sắm qua mạng, … với chất lượng cực tốt với hai công nghệ là SDTV và HDTV. Dịch vụ truyền hình cáp ra đời giúp chúng ta không còn thấy cảnh trên các mái nhà chứa đầy các anten vừa tốn kém vừa mất mỹ quan và có thể xảy ra nguy hiểm khi gãy ngã anten vào mùa mưa bão. Vừa qua Thủ tướng Chính phủ ra quyết định số 22/2009/QĐ-TTg bắt buộc các nhà cung cấp dịch vụ truyền hình cáp đến năm 2015 phải ngầm hoá tất cả các cáp truyền hình của mình, tạo nên mỹ quan cho đô thị và an toàn cho người dân. Dịch truyền hình cáp ra đời năng chất lượng truyền hình lên tầm cao mới. Chất lượng dịch vụ gần như hoàn hảo phục vụ tốt nhiệm vụ chính trị của nhà nước, nhu cầu quảng cáo của doanh nghiệp cũng như nhu cầu giải trí của người dân. Số lượng kênh nhiều, nội dung phong phú, đa dạng, … Dịch vụ truyền hình cáp ra đời đang thành công rực rỡ. Hứa hẹn sẽ tạo ra cuộc chạy đua mới trong công nghệ truyền hình, khiến các nhà cung cấp dịch vụ truyền hình đầu tư, nghiên cứu, khai thác các công nghệ mới như truyền hình di động, IPTV, … tạo ra bước đột phá trong công nghệ truyền hình, tạo nên sự đa dạng về dịch vụ phục vụ thị hiếu ngày càng cao của người dân. Giúp nâng cao đời sống văn hóa, tinh thần cho xã hội. Luận văn tốt nghiệp - 5 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận 3. Giới thiệu về chuẩn MPEG 3.1 Khái quát về các tiêu chuẩn nén Các tổ chức quốc tế đã•tiêu tốn hàng triệu USD để phát triển các tiêu chuẩn nén. Như vậy, có thể thấy các tiêu chuẩn nén là cần thiết. Hiểu một cách đơn giản, tiêu chuẩn nén cũng như ngôn ngữ chính thống của một đất nước. Quốc gia đó có nhiều dân tộc với nhiều ngôn ngữ khác nhau, nhưng để thuận lợi cho giao tiếp cần có một ngôn ngữ chính thống trên toàn lãnh thổ. Như vậy, chìa khoá ở đây là “sự dễ dàng trong giao tiếp”. Chúng ta cần các tiêu chuẩn nén để thuận tiện trao đổi giữa các hệ thống khác nhau. Vậy tại sao cần có nhiều tiêu chuẩn nén? Bởi vì chúng ta có nhiều ứng dụng nên đòi hỏi nhiều tiêu chuẩn khác nhau. Không có bất kỳ một tiêu chuẩn nén nào có thể đáp ứng được tất cả các yêu cầu ứng dụng khác nhau. Các tiêu chuẩn nén gồm hai mức: mức quốc gia và mức quốc tế.  Ở mức quốc gia: Có ANSI (American National Standard Institute), AIIM (Association of Image and Information), tại Canada có tổ chức tiêu chuẩn của Canada (Canadian Standards Association and the Standards Council of Canada).  Ở mức quốc tế: Có ISO (International Standards Organization), IEC (Interna- tional Electrotechnical Commission), ITU (International Telecommunication Union, CCITT) và một số tổ chức khác. Các tiêu chuẩn nén với ứng dụng của chúng được khái quát trong bảng sau đây: Chuẩn Phạm vi ứng dụng CCITT T.4 CCITT T.6 JPEG JBIG CCITT H.261 MPEG - 1 MPEG - 2 MPEG - 4 Fax, ảnh dữ liệu. Fax, ảnh dữ liệu. Ảnh. Fax, ảnh dữ liệu. Điện thoại hình. Ảnh, lưu trữ dữ liệu số (DSM). Ảnh, HDTV, DSM. Truyền thanh thông thường, quảng bá, cảm nhận từ xa. Bảng 1.1: Các tiêu chuẩn nén với các ứng dụng của nó Trong số đó, được sử dụng phổ biến và có phạm vi ứng dụng rộng rãi là MPEG (Moving Pictures Experts Group). MPEG là một chuỗi các chuẩn bao gồm: MPEG-1, MPEG-2 và MPEG-4. Trong đó MPEG-1 là cơ bản. MPEG-2 và MPEG-4 là sự phát triển và mở rộng từ MPEG-1. Luận văn tốt nghiệp - 6 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Hiệp hội Viễn thông Quốc tế (ITU) và tổ chức Tiêu chuẩn Quốc tế/Uỷ ban Kỹ thuật Điện tử Quốc tế (ISO/IEC) là hai tổ chức phát triển các tiêu chuẩn mã hoá video. Theo ITU, các tiêu chuẩn mã hoá video được coi là các khuyến nghị gọi tắt là chuẩn H.26x (H.261, H.262, và H.264). Với tiêu chuẩn ISO/IEC, chúng được gọi là MPEG-x (như MPEG-1, MPEG-2 và MPEG-4). 3.2 Chuẩn MPEG-2 MPEG-2 là một tiêu chuẩn được sử dụng rộng rãi trong kỹ thuật truyền hình số và kỹ thuật video số. MPEG-2 chia dòng tín hiệu thành hai loại là dòng truyền tải (TS- Transport Stream) và dòng chương trình (PS- Program Stream). MPEG-2 là tiêu chuẩn chung cho việc mã hoá audio và video. MPEG-2 ra đời khắc phục những thiếu sót trong MPEG-1 như: hệ thống nén âm thanh có hiệu quả kém, thiếu tính linh hoạt (có thể chấp nhận được ít hơn các biến thể của loại gói) không hỗ trợ cách quét xen kẻ. MPEG-2 nén tín hiệu video và audio với một dải tốc độ bit từ 1,5 Mbps tới 60 Mbps. Tiêu chuẩn này còn được gọi là chuẩn quốc tế ISO/IEC 13818, là chuẩn nén ảnh động và âm thanh. Nó cung cấp một dải các ứng dụng như: lưu trữ dữ liệu số, truyền hình quảng bá và truyền thông. 3.2.1 Các phần của MPEG-2 Phần 1 - Hệ thống: Mô tả cách đồng bộ, ghép kênh video và audio. Còn được gọi là ITU-T Rec. H.222.0. Phần 2 – Video: Mã hóa, nén tín hiệu video (xen kẻ và liên tục). Còn được gọi là ITU-T Rec. H.262. Phần 3 – audio: Nén, mã hóa các tín hiệu audio. Đa kênh–là phần mở rộng của MPEG-1 audio. Phần 4 : Mô tả các thủ tục để thử nghiệm sự phù hợp. Phần 5 : Mô tả cho các hệ thống phần mềm mô phỏng. Phần 6 : Mở rộng cho các mô tả DSM-CC (lưu trữ kỹ thuật số và kiểm soát). Phần 7 : Advanced Audio Coding (AAC). Phần 8 : Phần mở rộng video 10 bit. Ứng dụng chính là phòng thu video. Phần 8 đã được thu hồi vì thiếu quan tâm bởi tính công nghiệp. Phần 9 : Gia hạn thời gian thực cho các giao diện. Phần 10 : Phù hợp phần mở rộng cho DSM-CC. Phần 11 : Quản lý sở hữu trí tuệ (IPMP). Luận văn tốt nghiệp - 7 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận 3.2.2 Profiles và Levels MPEG - 2 video hỗ trợ rất nhiều ứng dụng từ thiết bị di động để hiệu chỉnh chất lượng cao. Việc định chuẩn cho nhiều ứng dụng khó thực hiện và quá tốn kém. Vì vậy MPEG-2 hỗ trợ các ứng dụng khác nhau thông qua định nghĩa Profiles và Levels. Profiles xác định nhóm các tính năng như các thuật toán nén, định dạng lấy mẫu tín hiệu màu thành phần, … Levels xác định về định lượng của: tốc độ bit cực đại, kích thước frame tối đa, … Các bảng dưới đây tóm tắt những quy định về các Profiles và Levels. MPEG-2 Levels Ký hiệu Tên Tốc độ frame (Hz) Độ phân giải hàng tối đa Độ phân giải cột tối đa Số mẫu của tín hiệu chói cực đại (=độ rộng x chiều ngang x tốc độ frame) Vmax trong MP (Mbps) LL Low Level 23,976; 24; 25; 29,97; 30 352 288 3.041.280 4 ML Main Level 23,976; 24; 25; 29,97; 30 720 576 10,368,000, ngoại trừ High profile, 14.475.600 của 4:2:0 và 11.059.200 của 4:2:2 15 H-14 High 1440 23,976; 24; 25; 29,97; 30; 50; 59,94; 60 1440 1152 47,001,600, ngoại trừ trong High profile với 4:2:0 là 62.668.800 60 HL High Level 23,976; 24; 25; 29,97; 30; 50; 59,94; 60 1920 1152 62,668,800, ngoài trừ trong High profile với 4:2:0, 83.558.400 80 Bảng 1.2: Các level Luận văn tốt nghiệp - 8 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận MPEG-2 Profiles Ký hiệu Tên Kiểu mã hóa Tỉ lệ lấy mẫu Tỉ lệ khuôn hình Modes scalable SP Simple profile I, P 4:2:0 4:3, hay 16:9 none MP Main profile I, P, B 4:2:0 4:3, hay 16:9 none SNR SNR Scalable profile I, P, B 4:2:0 4:3, hay 16:9 SNR (signal-to- noise ratio) Spatial Spatially Scalable profile I, P, B 4:2:0 4:3, hay16:9 SNR HP High profile I, P, B 4:2:2 hay 4:2:0 4:3, hay 16:9 SNR- or spatial- scalable Bảng 1.3: Các profile 3.2.3 Các ứng dụng của MPEG-2 a) DVD Các đĩa DVD sử dụng các tiêu chuẩn MPEG-2/video, phải tuân theo một số quy định sau:  •Các độ phân giải: + 720 × 480, 704 × 480, 352 × 480, 352 × 240 pixel (NTSC). + 720 × 576, 704 × 576, 352 × 576, 352 × 288 pixel (PAL).  •Tỉ lệ khuông hình: + 4:3. + 16:9.  Tốc độ frame: + 29,97 frame/s (NTSC). + 25 frame/s (PAL).  •Tốc độ bit của audio, video: + Video đỉnh 9,8 Mbps. Luận văn tốt nghiệp - 9 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận + Tổng số đỉnh 10,08 Mbps. + Tối thiểu 300 Kbps.  •YUV: 4:2:0.  Hộ trợ các phụ đề.  Audio: + Linear Pulse Code Modulation (LPCM): 48 KHz hay 96 KHz; 16 - bit hoặc 24-bit; lên đến sáu kênh (không phải tất cả các kênh có thể ghép được với nhau, mà còn phụ thuộc vào tốc độ bit). + MPEG Layer 2 (MP2): 48 KHz, lên tới 5.1 kênh (bất buộc cho riêng hệ PAL). + Dolby Digital (DD, còn được gọi là AC-3): 48 KHz, 32 - 448 Kbps, lên tới 5,1 kênh. + DTS-Digital Theater Systems (hệ thống nhà hát số): 754 Kbps hoặc 1510 Kbps (không bắt buộc đối với đầu DVD). + NTSC DVD phải chứa ít nhất một LPCM hoặc Dolby Digital âm thanh theo dõi. + PTZ DVD phải chứa ít nhất một lớp 2 MPEG, LPCM, hoặc theo dõi các âm thanh Dolby Digital.  GOP (Group of Pictures): + Header sequence phải được trình bày tại đầu của mỗi nhóm. + Giá trị lớn nhất của frame/GOP: 18 (NTSC), 15 (PAL) tức là 0,6 giây cả hai. b) Chuẩn DVB Ứng dụng cụ thể các quy định của MPEG-2 video trong tiêu chuẩn DVB:  Tiêu chuẩn SDTV: + 720, 640, 544, 480 hoặc 352×480 pixel, 24/1,001, 24, 30/1,001 hay 30 khung/s. + 352 × 240 pixel, 24/1,001, 24, 30/1,001 hay 30 khung/s. + 720, 704, 544, 480 hoặc 352 × 576 pixel, 25 khung/s. + 352 × 288 pixel, 25 khung/s.  Tiêu chuẩn HDTV: + 720 x 576 x 50 khung/s quét liên tục (576p50). + 1280 x 720 x 25 hoặc 50 khung/s quét liên tục (720p50). + 1440 hay 1920 x 1080 x 25 khung/s quét liên tục (1080p25). + 1440 hay 1920 x 1080 x 25 khung/s quét xen kẽ (1080i25). + 1920 x 1080 x 50 khung/s quét liên tục (1080p50). Luận văn tốt nghiệp - 10 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận c) Chuẩn ATSC và ISDB-T Các tiêu chuẩn ATSC A/53, được sử dụng tại Mỹ, sử dụng MPEG-2 video MP@ HL, với các quy định như sau:  Tốc độ tối đa của dòng video MPEG-2 là 19,4 Mbps cho phát sóng truyền hình, và 38,8 Mbps cho các chế độ “high-data-rate” (ví dụ như: truyền hình cáp).  Số lượng dòng đệm MPEG-2 được yêu cầu ở phía giải mã phải nhỏ hơn hoặc bằng 999.424 byte.  Các dòng phải bao gồm các phép đo thông tin (đường cong gamma, sử dụng các giá trị màu RGB, và các mối quan hệ giữa RGB và YCBCR).  Video được lấy mẫu 4:2:0 (màu thành bằng 1/2 của luma ngang và bằng 1/2 của luma dọc). Độ phân giải, tỷ lệ khuông hình, và tốc độ frame/ field của video:  1920 × 1080 pixel (16:9), tại 30p, 29,97p, 24p, 23,98p, 30i, hoặc 29,97i.  1280 × 720 pixel (16:9), tại 60p, 59,94p, 30p, 29,97p, 24p, hoặc 23,98p.  704 × 480 pixel (hoặc 4:3 hoặc 16:9), tại 60p, 59,94p, 30p, 29,97p, 24p, 23,98p, 30i, hoặc 29.97i.  640 ×480 pixel (4:3), tại 60p, 59,94p, 30p, 29,97p, 24p, 23,98p, 30i, hoặc 29,97i. 3.3 Tiêu chuẩn MPEG-4 3.3.1 Khái quát về MPEG-4 Kể từ khi mới xuất hiện vào đầu những năm 90, chuẩn MPEG-2 đã hoàn toàn thống lĩnh thế giới truyền thông. Cũng trong thập kỷ này, chuẩn nén MPEG-2 đã được cải tiến về nhiều mặt. Giờ đây nó có tốc độ bit thấp hơn và việc ứng dụng nó được mở rộng hơn nhờ có các kỹ thuật như đoán chuyển động, tiền xử lý, xử lý đối ngẫu và phân bổ tốc độ bit tùy theo tình huống thông qua ghép kênh. Tuy nhiên, chuẩn nén MPEG-2 cũng không thể được phát triển một cách vô hạn định. Thực tế hiện nay cho thấy chuẩn nén này đã đạt đến hết giới hạn ứng dụng của mình trong lĩnh vực truyền hình và lưu trữ video số. Bên cạnh đó, nhu cầu nén video lại đang ngày một tăng cao kèm theo sự phát triển mạnh mẽ của mạng IP mà tiêu biểu là mạng internet và công nghệ truyền hình HDTV. Khối lượng nội dung mà các công ty truyền thông cũng như các nhà cung cấp dịch vụ thông tin ngày càng lớn, ngoài ra họ còn có thể cung cấp nhiều dịch vụ theo yêu cầu thông qua hệ thống cáp, vệ tinh và các hạ tầng viễn thông đặc biệt là mạng internet. Các tiêu chuẩn mã hoá video ra đời và phát triển với mục tiêu cung cấp các phương tiện cần thiết để tạo ra sự thống nhất giữa các hệ thống được thiết kế bởi Luận văn tốt nghiệp - 11 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận những nhà sản xuất khác nhau đối với mọi loại ứng dụng video; Nhờ vậy thị trường video có điều kiện tăng trưởng mạnh. Chính vì lý do này nên những người sử dụng bộ giải mã cần có một chuẩn nén mới để đi tiếp chặng đường mà MPEG-2 đã bỏ dở. Và MPEG-4 đã ra đời. MPEG-4 là một tập hợp các phương pháp nén audio, video (AV) và dữ liệu kỹ thuật số. Nó đã được giới thiệu vào cuối 1998 và còn có tên gọi khác là tiêu chuẩn ISO/IEC 14496, hay H.264. Sử dụng nén AV, dữ liệu cho trang web và lưu trữ đĩa CD, voice (điện thoại, videophone) và phát sóng truyền hình. MPEG-4 hấp thụ rất nhiều các tính năng của MPEG-1 và MPEG-2 và các tiêu chuẩn khác có liên quan, bổ sung các tính năng mới (mở rộng) như VRML hỗ trợ cho biểu diễn 3D, đa hợp hướng đối tượng (bao gồm cả audio, video và các đối tượng VRML). Ban đầu, mục tiêu chủ yếu MPEG-4 là truyền video với tốc độ bit thấp, tuy nhiên sau đó phạm vi của nó đã được mở rộng hơn nữa của một tiêu chuẩn mã hóa đa phương tiện MPEG-4 sử dụng hiệu quả trên nhiều loại tốc độ bit khác nhau, từ một vài Kbps đến hàng chục Mbps. MPEG-4 cung cấp những chức năng sau đây:  Cải thiện hiệu quả mã hóa.  Khả năng mã hóa nhiều loại dữ liệu (video, âm thanh, lời nói).  Khả năng sữa lỗi cho phép truyền tốt hơn.  Khả năng tương tác với các thiết bị nghe nhìn ở phía thu. 3.3.2 Các phần trong MPEG-4 MPEG-4 bao gồm nhiều phần, mỗi phần có nhiều “Profiles” và “levels” Phần Tên khác Kiểu Mô tả Phần 1 ISO/IEC 14496-1 Systems Mô tả đồng bộ hóa và ghép kênh video và audio. Phần 2 ISO/IEC 14496-2 Visual Nén mã hóa dữ liệu hình ảnh Phần 3 ISO/IEC 14496-3 Audio Nén và mã hóa audio Phần 4 ISO/IEC 14496-4 Conformance Mô tả các thủ tục để thử nghiệm sự phù hợp các phần khác của tiêu chuẩn. Phần 5 ISO/IEC Reference Software Cung cấp phần mềm để chứng Luận văn tốt nghiệp - 12 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận 14496-5 minh và làm rõ các phần khác của tiêu chuẩn. Phần 6 ISO/IEC 14496-6 Delivery Multimedia Integration Framework (DMIF). Phần 7 ISO/IEC 14496-7 Optimized Reference Software Cung cấp các ví dụ về việc làm thế nào để triển khai thực hiện các cải tiến Phần 8 ISO/IEC 14496-8 Carriage on IP networks Xác định một phương pháp mang nội dung MPEG-4 trên mạng IP. Phần 9 ISO/IEC 14496-9 Reference Hardware Cung cấp thiết kế phần cứng dành cho chứng minh làm thế nào để thực hiện các phần khác của tiêu chuẩn. Phần 10 ISO/IEC 14496-10 Advanced Video Coding (AVC) Mã hóa tín hiệu video Phần 11 ISO/IEC 14496-11 Scene description and Application engine("BIFS") Có thể được sử dụng cho nhiều nội dung tương tác với nhiều profiles, bao gồm cả các phiên bản 2D và 3D. Phần 12 ISO/IEC 14496-12 ISO Base Media File Format Định dạng tập tin cho các phương tiện lưu trữ. Phần 13 ISO/IEC 14496-13 Intellectual Property Management and Protection (IPMP) Extensions. Phần 14 ISO/IEC 14496-14 MPEG-4 File Format Các thiết kế để chứa nội dung tập tin định dạng MPEG-4, mà là dựa trên Phần 12. Phần 15 ISO/IEC 14496-15 AVC File Format Để lưu trữ video của phần 10 dựa trên Phần 12. Phần 16 ISO/IEC 14496-16 Animation Framework eXtension (AFX). Chưa hoàn thành Phần 17 ISO/IEC Timed Text subtitle Chưa được hoàn thành Luận văn tốt nghiệp - 13 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận 14496-17 format. Phần 18 ISO/IEC 14496-18 Font Compression and Streaming (for OpenType fonts). Chưa được hoàn thành Phần 19 ISO/IEC 14496-19 Synthesized Texture Stream. Chưa hoàn thành Phần 20 ISO/IEC 14496-20 Lightweight Application Scene Representation (LASeR). Chưa được hoàn thành Phần 21 ISO/IEC 14496-21 MPEG-J Graphical Framework Xtension (GFX) Chưa được hoàn thành Phần 22 ISO/IEC 14496-22 Open Font Format Specification (OFFS) based on OpenType Chưa được hoàn thành Phần 23 ISO/IEC 14496-23 Symbolic Music Representation (SMR) Chưa được hoàn thành Bảng 1.4: Các phần của MPEG-4 Trong các phần của MPEG-4 có phần 10 là tương đối quan trọng vì nó quy định các cách thức nén video, sau đây ta tìm hiểu về phần này. 3.3.3 Tìm hiểu về MPEG-4 phần 10 a) Giới thiệu chung Những khuyến nghị của ITU được thiết kế dành cho các ứng dụng video truyền thông thời gian thực như truyền hình hội nghị hay videophone. Mặt khác, những tiêu chuẩn MPEG được thiết kế hướng tới mục tiêu lưu trữ video chẳng hạn như trên đĩa quang DVD, quảng bá video số trên mạng cáp, đường truyền số DSL, truyền hình vệ tinh hay những ứng dụng truyền dòng video trên mạng internet hoặc thông qua mạng không dây (wireless). Với đối tượng để truyền dẫn video HD thì ứng cử viên hàng đầu là chuẩn nén MPEG-4 AVC, còn được gọi là H.264, MPEG-4 phần 10, H.26L hoặc JVT. b) Các Profile và lelves của H.264 (MPEG-4 AVC) Luận văn tốt nghiệp - 14 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận  Profile có nhiều phần để phù hợp với các ứng dụng khác nhau: + Constrained Baseline Profile (CBP): Được sử dụng chủ yếu trong các ứng dụng thấp. Profile này được sử dụng rộng rãi trong các ứng dụng di động và truyền hình hội nghị. Nó tương ứng với các tính năng của các nhóm Baseline, Main, và High Profiles. + Baseline Profile (BP): Chủ yếu cho các ứng dụng giá rẻ với tài nguyên điện toán hạn chế, Profile này sẽ được sử dụng rộng rãi trong các ứng dụng di động và truyền hình hội nghị. + Main Profile (MP): Ban đầu nó được sử dụng cho truyền hình quảng bá. Profile này thật sự phai nhạt trước sự xuất hiện của High profile. + Extended Profile (XP): Profile này định dạng dòng video, và khả năng nén tương đối cao và bổ sung một số các thủ thuật bảo vệ chống mất dữ liệu và chuyển mạch luồng máy chủ. + High Profile (HiP): Profile này ứng dụng chính cho truyền hình quảng bá đặc biệt là các ứng dụng HDTV và việc lưu trữ như đĩa HD DVD và Blu-ray. + High 10 Profile (Hi10P): Profile này là sự phát triển của HiP với số bit mã hóa và lượng tử là 10 bit (HiP 8 bit). + High 4:2:2 Profile (Hi422P): Profile này xử lý tín hiệu video một cách chuyên nghiệp, profile này được xây dựng trên Hi10P hỗ trợ thêm định dạng 4:2:2, sử dụng 10 bit cho mã hóa và lượng tử. + High 4:4:4 Predictive Profile: Profile này phát triển dựa trên Hi422P hỗ trợ định dạng 4:4:4, sử dụng 14 bit cho việc mã hóa và lượng tử. CB P Baseline Extended Main High High 10 High 4:2:2 High 4:4:4 Predictive Slices I và P Ye s Yes Yes Yes Yes Yes Yes Yes Slices B No No Yes Yes Yes Yes Yes Yes Slices SI và SP No No Yes No No No No No Frames tham chiếu Ye s Yes Yes Yes Yes Yes Yes Yes In-Loop Deblocking Filter Ye s Yes Yes Yes Yes Yes Yes Yes Luận văn tốt nghiệp - 15 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận CAVLC Entropy Coding Ye s Yes Yes Yes Yes Yes Yes Yes CABAC Entropy Coding No No No Yes Yes Yes Yes Yes Flexible Macroblock Ordering (FMO) No Yes Yes No No No No No Arbitrary Slice Ordering (ASO) No Yes Yes No No No No No Redundant Slices (RS) No Yes Yes No No No No No Data Partitioning No No Yes No No No No No Interlaced Coding (PicAFF, MBAFF) No No Yes Yes Yes Yes Yes Yes Hệ số màu 4:2:0 Ye s Yes Yes Yes Yes Yes Yes Yes Hệ số màu đơn sắc (4:0:0) No No No No Yes Yes Yes Yes Hệ số màu 4:2:2 No No No No No No Yes Yes Hệ số màu 4:4:4 No No No No No No No Yes Lấy mẫu 8 Bit Ye s Yes Yes Yes Yes Yes Yes Yes Lấy mẫu 9 và 10 No No No No No Yes Yes Yes Lấy mẫu từ 11 đến 14 Bit No No No No No No No Yes Biến đổi thích nghi 8x8 và 4x4 No No No No Yes Yes Yes Yes Quantization Scaling Matrices No No No No Yes Yes Yes Yes Điều kiển riêng Cb và Cr No No No No Yes Yes Yes Yes Mã hóa màu riêng biệt No No No No No No No Yes Luận văn tốt nghiệp - 16 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Mã hóa dự đoán không tổn hao No No No No No No No Yes Bảng 1.5: Các tham số của profile  Levels: Số level Số MB max/ giây Kích thước khung max (MB) Vmax Baseline, Extended and Main Profiles Vmax của High Profile Vmax của High 10 Profile Vmax của High 4:2:2 and High 4:4:4 Predictive Các ví dụ về độ phân giải cao @ khung (lưu trữ khung tối đa) trong levels 1 1485 99 64 Kbps 80 Kbps 192 Kbps 256 Kbps 128x96@30.9 (8) 176x144@15.0 (4) 1b 1485 99 128 Kbps 160 Kbps 384 Kbps 512 Kbps 128x96@30.9 (8) 176x144@15.0 (4) 1,1 3000 396 192 Kbps 240 Kbps 576 Kbps 68 Kbps 176x144@30.3 (9) 320x240@10.0 (3) 352x288@7.5 (2) 1,2 6000 396 384 Kbps 480 Kbps 1152 Kbps 1536 Kbps 320x240@20.0 (7) 352x288@15.2 (6) 1,3 11880 396 768 Kbps 960 Kbps 2304 Kbps 3072 Kbps 320x240@36.0 (7) 352x288@30.0 (6) 2 11880 396 2 Mbps 2,5 Mbps 6 Mbps 8 Mbp 320x240@36.0 (7) 352x288@30.0 (6) 2,1 19800 792 4 Mbps 5 Mbps 12 Mbps 16 Mbps 352x480@30.0 (7) 352x576@25.0 (6) 2,2 20250 1620 4 Mbps 5 Mbps 12 Mbps 16 Mbps 52x480@30.7 (10) 352x576@25.6 (7) 720x480@15.0 (6) 720x576@12.5 (5) 3 40500 1620 10 Mbps 12,5 Mbps 30 Mbps 40 Mbps 352x480@61.4 (12) 352x576@51.1 (10) 720x480@30.0 (6) 720x576@25.0 (5) 3,1 108000 3600 14 Mbps 17,5 Mbps 42 Mbps 56 Mbps 720x480@80.0 (13) 720x576@66.7 (11) Luận văn tốt nghiệp - 17 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận 1280x720@30.0 (5) 3,2 216000 5120 20 Mbps 25 Mbps 60 Mbps 80 Mbps 1280x720@60.0 (5) 1280x1024@42.2 (4) 4 245760 8192 20 Mbps 25 Mbps 60 Mbps 80 Mbps 1280x720@68.3 (9) 1920x1080@30.1 (4) 2048x1024@30.0 (4) 4,1 245760 8192 50 Mbps 62,5 Mbps 150 Mbps 200 Mbps 1280720@68.3 (9) 1920x1080@30.1 (4) 2048x1024@30.0 (4) 4,2 522240 8704 50 Mbps 62,5 Mbps 150 Mbps 200 Mbps 1920x1080@64.0 (4) 2048x1080@60.0 (4) 5 589824 22080 135 Mbps 168,7 Mbps 405 Mbps 540 Mbps 1920x1080@72.3(13) 2048x1024@72.0(13) 2048x1080@67.8(12) 2560x1920@30.7 (5) 3680x1536@26.7 (5) 5,1 83040 36864 240 Mbps 300 Mbps 720 Mbps 960 Mbps 1920x1080@120.5(16) 4096x2048@30.0 (5) 4096x2304@26.7 (5) Bảng 1.6: Các tham số của level Vmax: Là tốc độ bit cực đại của tín hiệu video c) Tính kế thừa của chuẩn nén H.264 (MPEG-4 AVC) Mục tiêu chính của chuẩn nén H.264 đang phát triển nhằm cung cấp video có chất lượng tốt hơn nhiều so với những chuẩn nén video trước đây. Điều này có thể đạt được nhờ sự kế thừa các lợi điểm của các chuẩn nén video trước đây. Không chỉ thế, chuẩn nén H.264 còn kế thừa phần lớn lợi điểm của các tiêu chuẩn trước đó là H.262 (MPEG-2) bao gồm 4 đặc điểm chính như sau:  Phân chia mỗi hình ảnh thành các Block (bao gồm nhiều điểm ảnh), do vậy quá trình xử lý từng ảnh có thể được tiếp cận tới mức Block.  Khai thác triệt để sự dư thừa về mặt không gian tồn tại giữa các hình ảnh liên tiếp bởi một vài mã của những Block gốc thông qua dự đoán về không gian, phép biến đổi, quá trình lượng tử và mã hoá Entropy (hay mã có độ dài thay đổi VLC).  Khai thác sự phụ thuộc tạm thời của các Block của các hình ảnh liên tiếp bởi vậy chỉ cần mã hoá những chi tiết thay đổi giữa các ảnh liên tiếp. Việc này được Luận văn tốt nghiệp - 18 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận thực hiện thông qua dự đoán và bù chuyển động. Với bất kỳ Block nào cũng có thể được thực hiện từ một hoặc vài ảnh mã hoá trước đó hay ảnh được mã hoá sau đó để quyết định vector chuyển động, các vector này được sử dụng trong bộ mã hoá và giải mã để dự đoán các loại Block.  Khai thác tất cả sự dư thừa về không gian còn lại trong ảnh bằng việc mã các block dư thừa. Ví dụ như sự khác biệt giữa block gốc và block dự đoán sẽ được mã hoá thông qua quá trình biến đổi, lượng tử hoá và mã hoá Entropy. d) Cơ chế nén ảnh của H.264 (MPEG-4 AVC) Với chuẩn nén H264, mỗi hình ảnh được phân chia thành nhiều block, mỗi block tương ứng với một số lượng nhất định các MacroBlock. Ví dụ một hình ảnh có độ phân giải QCIF (tương đương với số lượng điểm ảnh 176x144) sẽ được chia thành 99 MacroBlock với kích cỡ 16x16. Một sự phân đoạn các MacroBlock tương tự được sử dụng các kích cỡ ảnh khác. Thành phần chói của ảnh được lấy mẫu tương ứng với độ phân giải của ảnh đó, trong khi đó thành phần màu CR và CB được lấy mẫu với tần số thấp hơn theo 2 chiều ngang và dọc. Thêm vào đó mỗi hình ảnh có thể được phân thành số nguyên lần các lát (slice), việc này rất có giá trị cho việc tái đồng bộ trong trường hợp lỗi dữ liệu.  Giảm bớt độ dư thừa: Cũng giống như các bộ giải mã khác, H.264 nén video bằng cách giảm bớt độ dư thừa cả về không gian và thời gian trong hình ảnh. Những dư thừa về mặt thời gian là những hình ảnh giống nhau lặp đi lặp lại từ khung (frame) này sang khung khác, ví dụ như phần phông nền không chuyển động của một chương trình đối thoại trên truyền hình. Dư thừa về không gian là những chi tiết giống nhau xuất hiện trong cùng một khung, ví dụ như nhiều điểm ảnh giống nhau tạo thành một bầu trời xanh.  Chọn chế độ, phân chia và chế ngự: Bộ lập giải mã bắt đầu bằng việc quyết định loại khung cần nén tại một thời điểm nhất định và chọn chế độ mã hoá phù hợp. Chế độ “Intra” tạo ra ảnh “I”, trong khi chế độ “Inter” tạo ra khung “P” hoặc “B". Sau đó, bộ mã hoá sẽ chia ảnh thành hàng trăm hàng và cột các điểm ảnh của ảnh video số chưa nén thành các khối nhỏ hơn, mỗi khối có chứa một vài hàng và cột điểm ảnh.  Nén theo miền thời gian: Khi bộ mã hoá đang hoạt động ở chế độ “giữa khối” (inter), khối này sẽ phải qua công đoạn hiệu chỉnh chuyển động. Quá trình này sẽ phát hiện ra bất kỳ chuyển động nào diễn ra giữa khối đó và một khối tương ứng ở một hoặc hơn một ảnh tham chiếu đã được lưu trữ từ trước, sau đó tạo ra một khối “chênh lệch” hoặc “lỗi”. Thao tác này sẽ giảm bớt dữ liệu trong mỗi block một cách hiệu quả do chỉ phải trình bày chuyển động của nó mà thôi. Tiếp đến là công đoạn biến đổi côsin rời rạc (DCT-Discrete Cosine Transform) để bắt đầu nén Luận văn tốt nghiệp - 19 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận theo miền không gian. Khi bộ mã hoá hoạt động ở chế độ “trong khối” (intra), khối này sẽ bỏ qua công đoạn hiệu chỉnh chuyển động và tới thẳng công đoạn DCT.  Nén theo miền không gian: Các khối thường có chứa các điểm ảnh tương tự hoặc thậm chí giống hệt nhau. Trong nhiều trường hợp, các điểm ảnh thường không thay đổi mấy (nếu có). Như vậy có nghĩa là tần số thay đổi giá trị điểm ảnh trong khối này là rất thấp. Những khối như thế được gọi là khối có tần số không gian thấp. Bộ lập mã lợi dụng đặc điểm này bằng cách chuyển đổi các giá trị điểm ảnh của khối thành các thông tin tần số trong công đoạn biến đổi côsin rời rạc. + Biến đổi cosin rời rạc: Công đoạn DCT biến đổi các giá trị điểm ảnh của khối thành một ma trận gồm các hệ số tần số ngang, dọc đặt trong không gian tần số. Khi khối ban đầu có tần số không gian thấp, DCT sẽ tập hợp phần lớn năng lượng vào góc tần số thấp của mạng. Nhờ vậy, những hệ số tần số thấp ở góc đó sẽ có giá trị cao hơn. Một số lượng lớn các hệ số khác còn lại trên ma trận đều là các hệ số có tần số cao, năng lượng thấp và có giá trị thấp. Hệ số DC và một vài hệ số tần số thấp sẽ hàm chứa phần lớn thông tin được mô tả trong khối ban đầu. Điều này có nghĩa là bộ lập mã có thể loại bỏ phần lớn hệ số tần số cao còn lại mà không làm giảm đáng kể chất lượng hình ảnh của khối. Bộ lập mã chuẩn bị các hệ số cho công đoạn này bằng cách quét chéo mạng lưới theo đường zig-zag, bắt đầu từ hệ số DC và qua vị trí của các hệ số ngang dọc tăng dần. Do vậy nó tạo ra được một chuỗi hệ số được sắp xếp theo tần số. + Lượng tử hoá và mã hoá entropy: Tại đây thao tác nén không gian mới thực sự diễn ra. Dựa trên một hệ số tỷ lệ (có thể điều chỉnh bởi bộ mã hoá), bộ lượng tử hoá sẽ cân đối tất cả các giá trị hệ số. Do phần lớn hệ số đi ra từ DCT đều mang năng lượng cao nhưng giá trị thấp nên bộ lượng tử hoá sẽ làm tròn chúng thành 0. Kết quả là một chuỗi các giá trị hệ số đã được lượng tử hoá bắt đầu bằng một số giá trị cao ở đầu chuỗi, theo sau là một hàng dài các hệ số đã được lượng tử hoá về 0. Bộ lập mã entropy có thể theo dõi số lượng các giá trị 0 liên tiếp trong một chuỗi mà không cần mã hoá chúng, nhờ vậy giảm bớt được khối lượng dữ liệu trong mỗi chuỗi. e) Các ưu điểm nổi bật của chuẩn nén H.264 (MPEG-4 AVC)  Ưu điểm của nén không gian: Chuẩn nén MPEG-4 AVC có hai cải tiến mới trong lĩnh vực nén không gian. Trước hết, bộ lập mã này có thể tiến hành nén không gian tại các macroblock 16x16 điểm ảnh thay vì các block 8x8 như trước đây. Điều này giúp tăng cường Luận văn tốt nghiệp - 20 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận đáng kể khả năng nén không gian đối với các hình ảnh có chứa nhiều khoảng lớn các điểm ảnh giống nhau. Thứ hai là thao tác nén được tiến hành trong miền không gian trước khi công đoạn DCT diễn ra. Chuẩn nén MPEG-4 AVC so sánh macroblock hiện thời với các macroblock kế bên trong cùng một khung, tính toán độ chênh lệch, và sau đó sẽ chỉ gởi đoạn chênh lệch tới DCT. Hoặc là nó có thể chia nhỏ macroblock 16x16 điểm ảnh thành các khối 4x4 nhỏ hơn và so sánh từng khối này với các khối kế bên trong cùng một macroblock. Điều này giúp cải thiện khả năng nén ảnh chi tiết.  Ưu điểm của nén thời gian: Điểm cải tiến lớn nhất ở MPEG-4 AVC là chế độ mã hoá giữa. Những phương pháp tiên tiến ở chế độ này khiến cho nén thời gian đạt đến một cấp độ cao hơn nhiều, cùng với chất lượng chuyển động tốt hơn so với các chuẩn MPEG trước đây.  Kích cỡ khối: Ở chế độ giữa khối, MPEG-2 chỉ hỗ trợ các macroblock 16x16 điểm ảnh, không đủ độ phân giải để mã hoá chính xác các chuyển động phức tạp hoặc phi tuyến tính, ví dụ như phóng hay to thu nhỏ. Ngược lại, MPEG-4 AVC lại tăng cường hiệu chỉnh chuyển động bằng cách cho phép bộ lập mã biến đổi kích cỡ thành phần chói của mỗi macroblock. (Bộ lập mã sử dụng thành phần chói như vậy là do mắt người nhạy cảm với chuyển động chói hơn nhiều so với chuyển động màu.) MPEG-4 AVC có thể chia thành phần chói của từng macroblock thành 4 cỡ: 16x16, 16x8, 8x16 hoặc 8x8. Khi sử dụng khối 8x8, nó còn có thể chia tiếp 4 khối 8x8 này thành 4 cỡ nữa là 8x8, 8x4, 4x8 hoặc 4x4. Hình 1.1: MPEG-4 AVC có thể phân chia thành phần chói của từng MacroBlock theo nhiều cách để tối ưu hoá việc bù chuyển động. Việc phân chia các macroblock cho phép bộ lập mã xử lý được một vài loại chuyển động tuỳ theo độ phức tạp của chuyển động đó cũng như nguồn lực về tốc độ bit. Nhìn chung, kích cỡ phân chia lớn phù hợp với việc xử lý chuyển động tại các khu vực giống nhau trong ảnh, trong khi đó kích cỡ phân chia nhỏ lại rất có ích khi xử Luận văn tốt nghiệp - 21 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận lý chuyển động tại các chỗ có nhiều chi tiết hơn. Kết quả là chất lượng hình ảnh cao hơn, ít bị vỡ khối hơn. Các cuộc thử nghiệm đã chỉ ra rằng việc sắp xếp hợp lý các khung có thể tăng tỷ lệ nén thêm 15%. MPEG-4 AVC lấy phần chói của ảnh gốc và sử dụng các macroblock đã được chia nhỏ tại các khu vực có nhiều chi tiết nhằm tăng cường khả năng hiệu chỉnh chuyển động. + Độ chính xác trong hiệu chỉnh chuyển động Trong đa số trường hợp, chuyển động tại rìa mỗi macroblock hay khối thường diễn ra với độ phân giải nhỏ hơn một điểm ảnh. Do vậy, chuẩn nén MPEG-4 AVC có thể đảm bảo độ chính xác trong hiệu chỉnh chuyển động lên tới 1/4 hoặc 1/8 điểm ảnh, trong khi các chuẩn MPEG trước đây chỉ dừng lại ở mức 1/2 điểm ảnh. Khả năng đạt mức chính xác 1/8 ảnh điểm của MPEG-4 AVC giúp tăng hiệu suất mã hoá tại tốc độ bit cao và độ phân giải video cao. Các thử nghiệm cho thấy độ chính xác đến 1/4 điểm ảnh có thể làm giảm tốc độ bit xuống hơn 15% so với độ chính xác 1 điểm ảnh. + Chọn nhiều hình tham chiếu Chuẩn nén MPEG-2 chỉ dựa trên hai khung tham chiếu để dự đoán các chuyển động mang tính chu kỳ. Tuy nhiên, khi camera thay đổi góc quay hay chuyển qua chuyển lại giữa các cảnh, việc chỉ sử dụng hai khung tham chiếu không còn phù hợp để dự đoán chính xác chuyển động. Tương tự như vậy, để đoán trước các chuyển động phức tạp như sóng biển hay một vụ nổ, ta cần phải có nhiều hơn hai khung tham chiếu. Vì thế, chuẩn MPEG-4 AVC cho phép có tới năm khung tham chiếu phục vụ cho việc mã hoá giữa khung. Kết quả là chất lượng video tốt hơn và hiệu suất nén cao hơn. + Giải khối tích hợp Video số sau khi nén thường tạo ra một hiệu ứng gọi là “kết khối”, có thể thấy rõ tại điểm giao nhau giữa các khối, đặc biệt là khi có tốc độ bit thấp. Hiệu ứng này là do công đoạn xử lý sử dụng nhiều loại chuyển động và bộ lượng tử khác nhau. Đối với MPEG-2, cách duy nhất để ngăn chặn hiệu ứng này là sử dụng các cơ chế hậu xử lý phù hợp, tuy nhiên các cơ chế này lại không tương thích được với tất cả các máy thu. Chuẩn nén MPEG-4 AVC đưa vào sử dụng một bộ lọc giải khối hoạt động ở hai cấp độ: macroblock 16x16 và khối 4x4. Việc giải khối thường tạo ra một tỉ số tín hiệu trên nhiễu (SNR-Signal-to-noise ratio) cực điểm thấp hơn, tuy nhiên nhìn một cách chủ quan thì nó tạo ra hình ảnh chất lượng tốt hơn.  Ưu điểm về lượng tử hoá và biến đổi: Chấm di động 8x8 DCT cùng với dung sai của lỗi làm tròn chính là phần cốt lõi của các chuẩn MPEG trước đây. MPEG-4 AVC độc đáo hơn ở chỗ nó sử dụng Luận văn tốt nghiệp - 22 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận biến đổi không gian nguyên (gần giống như DCT) đối với các khối 4x4 điểm ảnh. Kích cỡ nhỏ giúp giảm bớt hiện tượng “kết khối”, trong khi thông số nguyên tuyệt đối giúp loại bỏ nguy cơ không thích ứng giữa bộ lập mã và giải mã trong phép biến đổi ngược. Thêm vào đó, dãy hệ số xích lượng tử lớn hơn khiến cho cơ chế kiểm soát tốc độ dữ liệu ở bộ lập mã hoạt động một cách linh hoạt hơn dựa trên một tỉ lệ phức hợp vào khoảng 12,5% thay cho một mức tăng lượng gia không đổi.  Ưu điểm đối với mã hoá entropy: Sau khi tiến hành hiệu chỉnh, biến đổi và lượng tử hoá chuyển động, các bộ lập mã MPEG trước đây sẽ vạch ra các symbol biểu diễn vector chuyển động và hệ số đã lượng tử hoá thành các bit thực sự. Ví dụ như chuẩn nén MPEG-2 sử dụng phương pháp mã có chiều dài biến thiên tĩnh (VLC-Variable-length code) không thể tối ưu hoá trong môi trường video thời gian thực (trong đó nội dung và các cảnh biến đổi theo thời gian). MPEG-4 AVC sử dụng mã hoá thuật toán nhị phân theo tình huống CABAC (Context-Adaptive Binary Arithmetic Coding). Hiệu suất mã hoá của CABAC cao hơn hẳn nhờ khả năng thích nghi với các thay đổi có thể xảy ra trong phân bổ symbol. Ví dụ, nó có thể khai thác sự tương quan giữa các symbol và từ đó sử dụng sự tương quan bit và thuật toán mã hoá. Cơ chế này có thể giúp tiết kiệm thêm một lượng bit vào khoảng hơn 5%. f) Kết luận MPEG-4 AVC đánh dấu một bước ngoặt trong lĩnh vực nén video, áp dụng các kỹ thuật tiên tiến nhằm mục đích sử dụng băng thông hiệu quả hơn và đem lại chất lượng ảnh cao hơn. Với các kỹ thuật này, MPEG-4 AVC có thể giảm tốc độ bit xuống hơn 50% so với chuẩn MPEG-2. Tuy nhiên, MPEG-4 AVC đòi hỏi một cấp độ phức tạp cao hơn trong cả quá trình mã hóa lẫn giải mã. Mặc dù vậy, thử thách này hoàn toàn có thể chinh phục được nhờ có những tiến bộ mới liên tiếp trong khả năng xử lý phần mềm cũng như phần cứng. Điều này có nghĩa là MPEG-4 AVC có khả năng thay thế hoàn toàn MPEG-2 trong thời gian tới. Luận văn tốt nghiệp - 23 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Chương 2: Công nghệ nén và ghép kênh 1. Công nghệ nén 1.1 Nhu cầu của công nghệ nén trong truyền hình Với công nghệ số phát triển vượt bậc như hiện nay, các thiết bị đều có dải thông nhất định, các dòng tín hiệu số tốc độ cao yêu cầu dải thông rất rộng vượt quá khả năng cho phép của các thiết bị. Một cách sơ bộ, nén là quá trình làm giảm tốc độ bit của các dòng dữ liệu tốc độ cao mà vẫn đảm bảo chất lượng dữ liệu cần lưu trữ hoặc truyền tải. Ví dụ như tín hiệu video sau khi được số hóa 8 bit có tốc độ 216 Mbps, với tốc độ này vượt quá khả năng truyền của một kênh truyền hình, vì vậy trong lĩnh vực truyền hình việc sử dụng công nghệ nén gần như tất yếu để giảm tốc độ bit. Trung tâm của mạng phát sóng video số bao gồm hệ thống nén, nó cung cấp chương trình video, audio chất lượng cao cho người xem bằng cách chỉ sử dụng một phần nhỏ độ rộng băng tần mạng. Mục đích của nén dữ liệu là tối thiểu hóa khả năng lưu trữ và truyền dẫn phát sóng thông tin (ghép nhiều thông tin vào một dòng truyền). Hệ thống nén tín hiệu bao gồm các bộ mã hóa số và các bộ ghép kênh, các bộ giải mã có nhiệm vụ chuyển tín hiệu analog sang số có nén và xáo trộn thành một dòng audio-video và dữ liệu khác dưới dạng số có nén. Mã hóa số cho phép truyền dẫn phát sóng nhiều chương trình audio-video chất lượng cao qua cùng độ rộng băng tần như một kênh sóng audio-video analog (8 MHz ở Việt Nam). 1.2 Công nghệ nén audio chuẩn ISO/MPEG-1 Đây là tiêu chuẩn mã hóa audio với tần số lấy mẫu là 32,441 KHz và 48 KHz, tốc độ bit khoảng 32-192 Kbps cho âm thanh mono và 64-384 Kbps cho âm thanh stereo. Có hai phương pháp để giảm tốc độ bit của tín hiệu audio:  Phương pháp 1: Chủ yếu là loại bỏ tín hiệu dư thừa audio bằng phép tương quan thống kê.  Phương pháp 2: Sử dụng che mặt nạ thời gian và phổ tần số. Sử dụng hai phương pháp trên thì tốc độ bit cần truyền giảm xuống 200 Kbps và thậm chí thấp hơn đối với âm thanh stereo. Sau đây là sơ đồ hệ thống audio trong truyền hình số. Luận văn tốt nghiệp - 24 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Hình 2.1: Hệ thống audio trong truyền hình số Sau đây ta xét sơ đồ mạch mã hóa và giải mã của hệ thống audio lớp 1 và 2 theo tiêu chuẩn (ISO/MPEG). Hình 2.2: Sơ đồ khối mạch mã hoá audio lớp 1 và 2 theo chuẩn ISO/IEC 11172-1, 2 Tùy thuộc vào từng ứng dụng khác nhau, hệ thống mã hóa tín hiệu audio có ba lớp với mức độ phức tạp tăng dần. Đối với cả ba lớp tín hiệu được biến đổi từ miền thời gian sang miền tần số bằng 32 băng lọc phụ. Hình 2.3: Sơ đồ khối mạch giải mã audio lớp 1 và 2 theo chuẩn ISO/IEC 11172-2 Dữ liệu audio đã mã hóa Mô hình “Tâm lý âm thanh” Biểu số FFT (1024 điểm) Băng lọc (32 băng phụ) Lượng tử hóa tuyến tính Mã hóa các thông tin phụ Định dạng dòng bit và mã sữa sai Điều kiển từ xa Dữ liệu audio vào Dữ liệu phụ 0 31 31 0 Audio vào Inner Interleaver Giải mã audio Mở gói PES Mã hóa audio Đóng gói Đóng gói Giải điều chế RF Dòng ES Dòng PES Dòng PES RF Audio ra Tách kênh và phát hiện lỗi, sửa sai Giải lượng tử Quá trình ngược của băng lọc (32 băng phụ) Giải mã thông tin phụ Dữ liệu đã mã hoá Dữ liệu phụ 0 31 31 0 Tín hiệu audio stereo Luận văn tốt nghiệp - 25 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Lớp 1, 2 biểu thị tín hiệu audio đầu vào bằng 32 băng lọc phụ, những thông số này được lượng tử hóa và mã hóa dưới sự khống chế của mô hình âm thanh. Lớp 1 chỉ biến thể giản ước của phương pháp mã hóa MPEG-1 và được sử dụng chủ yếu trong các ứng dụng dân dụng. Lớp 2 thực hiện việc nén tín hiệu và thực hiện việc lượng tử hóa tinh hơn, ứng dụng nhiều kể cả dân dụng lẫn chuyên dụng. Hình 2.4: Sơ đồ khối mạch giải mã audio lớp 3 theo chuẩn ISO/IEC 11172-3 Hình 2.5: Sơ đồ khối mạch giải mã audio lớp 3 theo chuẩn ISO/IEC 11172-3 Lớp 3 là sự mã hóa các môđun hiệu quả của 2 loại mã ASPEC và MUSICAM. Mỗi băng lọc phụ lại được chia nhỏ nhiều đường nên có độ phân giải cao hơn. Ở lớp này nếu muốn hiệu quả nén cao phải dùng phương pháp lượng tử hóa phi tuyến. 1.3 Công nghệ nén video chuẩn MPEG 1.3.2 Nén video theo chuẩn MPEG-1 Tiêu chuẩn MPEG-1 gồm 4 phần: Phần 1: Hệ thống (ISO/IEC 11172-1). Phần 2: Nén video (ISO/IEC 11172-2). Phần 3: Nén audio (ISO/IEC 11172-3). Dữ liệu audio đã mã hoá Dữ liệu audio vào Biểu số FFT (1024 điểm) Băng lọc (32 băng phụ) DCT Mã hóa các thông tin phụ Định dạng dòng bit và mã sữa sai Mô hình Điều kiển từ xa Dữ liệu phụ 0 31 575 0 -Vòng kiểm soát méo -Lượng tử hoá phi tuyến tính -Vòng kiểm soát tốc độ bít 0 575 Mã hoá Huffanm 0 575 Tín hiệu audio stereo Tăng kênh và phát hiện lỗi, sữa sai DCT Giải mã thông tin phụ Quá trình ngược của băng lọc (32 băng phụ) Dữ liệu audio vào Dữ liệu phụ 0 575 31 0 Giải lượng tử 0 575 DCT 0 31 Luận văn tốt nghiệp - 26 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Phần 4: Kiểm tra (ISO/IEC 11172- 4). MPEG-1 nghiên cứu cách thức ghép nối một hoặc vài dòng dữ liệu chứa thông tin thời gian để hình thành nên một dòng dữ liệu. Nó cung cấp qui tắc cú pháp đồng bộ hoá quá trình phát lại cho một dải ứng dụng video rộng. MPEG-1 coi ảnh chuyển động như dạng thức dữ liệu máy tính (gồm các điểm ảnh). Cũng như các dữ liệu máy tính (ảnh và văn bản), ảnh video chuyển động có khả năng truyền và nhận bằng máy tính và mạng truyền thông. Chúng cũng có thể được lưu trữ trong các thiết bị lưu trữ dữ liệu số như đĩa CD và ổ quang. MPEG-1 cung cấp cả các ứng dụng đối xứng và không đối xứng:  Trong ứng dụng không đối xứng, ảnh động được nén một lần, sau đó giải nén nhiều lần để truy cập thông tin, ví dụ trò chơi games.  Trong ứng dụng đối xứng, quá trình nén và giải nén phải cân bằng nhau. Ví dụ: điện thoại hình, thư điện tử. Để đạt được hiệu suất nén cao mà vẫn giữ tốt chất lượng ảnh phục hồi, chuẩn MPEG-1 sử dụng cả công nghệ nén trong ảnh (Intraframe) và liên ảnh (Interframe) để loại bỏ được cả sự dư thừa không gian và thời gian. Do MPEG-1 được phát triển cho lưu trữ dữ liệu số nên đòi hỏi có sự truy cập ngẫu nhiên (Random Access). Cách thức mã hoá tốt nhất cho truy cập ngẫu nhiên là mã hoá Intraframe đơn thuần. Song do sự dư thừa thông tin về thời gian chưa được loại bỏ nên hiệu suất nén rất thấp. Do vậy trong tiêu chuẩn nén MPEG-1, có sự cân bằng giữa nén trong ảnh và nén liên ảnh bằng cách sử dụng các công nghệ sau đây:  Bù chuyển động.  Dự báo.  Nội suy.  Biến đổi cosine rời rạc.  Lượng tử hoá.  Mã•hoá độ dài thay đổi (mã Huffman-VLC). Tức là có sự kết kết hợp hai công nghệ nén DPCM (Differential Pluse Code Modulation–điều chế mã xung vi sai) và TC (Trasform Codin-mã hóa chuyển đổi). Thuật toán nén MPEG-1 sử dụng bù chuyển động khối để giảm sự dư thừa thời gian với vector chuyển động cho mỗi khối kích thước 16x16 điểm ảnh. Bù chuyển động được sử dụng cho cả dự báo nhân quả và không nhân quả.  Dự báo nhân quả tạo dự báo ảnh hiện hành từ ảnh trước đó.  Dự báo không nhân quả tạo dự báo cho ảnh hiện hành dựa trên ảnh trong quá khứ và cả tương lai. Luận văn tốt nghiệp - 27 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Vòng lặp DPCM được sử dụng để tạo khung sai số dự báo. Sau đó, công nghệ mã hoá chuyển đổi chuyển khung sai số này sang miền tần số để nén các hệ số nhờ lượng tử hoá và mã hoá Huffman trước khi truyền tải hay lưu trữ. a) Các thành phần ảnh cơ bản trong chuẩn nén MPEG Các tiêu chuẩn MPEG, cấu trúc dữ liệu đều ở dạng lớp. Bao gồm các thành phần cơ bản sau đây: Hình 2.6: Cấu trúc lớp dữ liệu trong MPEG  Khối (Block): Là đơn vị cơ bản cho chuyển đổi DCT. Bao gồm 8x8 điểm ảnh tín hiệu chói hoặc tín hiệu màu.  Macro Block: Là nhóm các khối DCT tương ứng với thông tin của một cửa sổ 16x16 điểm ảnh gốc. Có nhiều dạng Macro Block khác nhau phụ thuộc vào cấu trúc lấy mẫu được sử dụng. Lớp nhóm ảnh (GOP layer) Lớp khung (Frame layer) MB MB MB MB MB MB MB MB MB MB Khung I Khung B Khung P Khung B Khung I Khung B GOP #p GOP #p+1 GOP #p+2 GOP #p+3 GOP #p+4 GOP #p+5 Chuỗi video #1 Chuỗi video #2 Chuỗi video #n Đặc điềm MB Vecto chuyển động Khối Y Khối Y Khối Y Khối Y Khối CB Khối CR Các hệ số DCT EOB 8x8 điểm chói Lớp chuỗi ảnh (Sequence layer) Sequence header) Sequence end code Dòng sơ cấp GOP header Frame header Slice header Lớp lát (Slice layer) Dữ liệu khung CCIR-601 Lớp MB (Macrokblock layer) Lớp khối DCT (Block layer) Luận văn tốt nghiệp - 28 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Hình 2.7: Cấu trúc Macroblock của các dạng lấy mẫu Phần đầu đề (header) của Macroblock chứa thông tin phân loại (Y hay CB, CR) và vector bù chuyển động tương ứng.  Lát (slice): Được cấu thành từ một hay một số MB liên tiếp nhau. Phần header của slice chứa thông tin về vị trí của nó trong ảnh và tham số quét lượng tử (quantized scaling factor). Kích cỡ của slice quyết định bởi mức bảo vệ lỗi cần có trong ứng dụng vì bộ giải mã sẽ bỏ qua slice bị lỗi. Hệ số một chiều DC được định vị tại điểm bắt đầu mỗi slice.  Ảnh: Lớp ảnh cho bên thu biết về loại mã hoá khung ( I,P,B). Phần header mang thứ tự, ngoài ra còn có một số thông tin bổ sung như thông tin đồng bộ, độ phân giải và vector chuyển động.  Nhóm ảnh (GOP-group of picture): Gồm cấu trúc các ảnh I, B và P. Mỗi nhóm bắt đầu bằng ảnh I cung cấp điểm vào ra và tìm kiếm. Phần header chứa 25 bit thời gian và chế độ điều khiển cho VTR và thông tin thời gian.  Chuỗi Video (Video Sequence): Lớp chuỗi bao gồm phần header, một hoặc một số nhóm ảnh (Picture Group) và phần kết thúc chuỗi (Sequence end Code). Thông tin quan trọng nhất của phần header là kích thước (dọc, ngang) của mỗi ảnh, tốc độ bit, tốc độ ảnh và dung lượng đòi hỏi bộ đệm dữ liệu bên thu. Thông tin chuỗi ảnh và phần header của chuỗi là dòng bit đã mã hoá, còn gọi là dòng video cơ bản. Trong MPEG có các cấu trúc nhóm ảnh điển hình như sau: 1 2 3 4 1 2 3 4 5 6 7 8 9 10 11 12 5 6 6 2 5 1 1 2 3 4 4 3 4:2:2 Macroblock 4:4:4 Macroblock 4:2:0 Macroblock 4:1:1 Macroblock Y Y CB CR CB CR CB/B CR/R Y/G Y CB CR 5 7 8 6 Luận văn tốt nghiệp - 29 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Hình 2.8: Các cấu trúc nhóm ảnh trong tiêu chuẩn MPEG b) Sự phân loại ảnh trong MPEG Tiêu chuẩn nén video MPEG định nghĩa 3 loại ảnh: ảnh I, ảnh B và ảnh P.  Ảnh I: (Intra - Coded Picture) Các ảnh I được mã hoá theo mode Intra để có thể giải mã mà không cần sử dụng dữ liệu từ bất cứ một ảnh nào khác. Đặc điểm của phương pháp mã hoá này như sau: + Chỉ loại bỏ được sự dư thừa không gian. + Dùng các điểm trong cùng một khung để tạo dự báo. + Không có bù chuyển động. + Các thông tin được mã hoá rõ ràng, minh bạch nên số lượng bit yêu cầu lớn. Do được mã hoá Intra, ảnh I bao giờ cũng là ảnh đầu tiên trong một nhóm ảnh hay một chuỗi ảnh. Nó cung cấp thông tin khởi động các ảnh tiếp theo trong nhóm.  Ảnh P (Predictive Code Picture) Ảnh P được mã hoá liên ảnh một chiều (Interframe một chiều): + Dự báo Inter một chiều. F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 I B B P B B P B B I I B I I B P I P Khung CCIR-601 nguyên thủy Khung đã nén Cấu trúc IBBPBBPBBI Cấu trúc IBI Cấu trúc IBP Cấu trúc IP Luận văn tốt nghiệp - 30 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận + Ảnh dự báo được tạo ảnh tham chiếu trước đó (dự báo nhân quả). Ảnh tham chiếu này có thể là ảnh I hoặc ảnh P gần nhất. + Có sử dụng bù chuyển động. Thông tin ước lượng chuyển động của các khối nằm trong vector chuyển động (motion vector). Vector này xác định Macroblock nào được sử dụng từ ảnh trước. Do vậy ảnh P bao gồm cả những MB mã hoá Inter (I - MB) là những macroblock chứa thông tin lấy từ ảnh tham chiếu và những MB mã hoá Intra là những MB chứa thông tin không thể mượn từ ảnh trước. Ảnh P có thể được sử dụng làm ảnh tham chiếu tạo dự báo cho ảnh sau.  Ảnh B (Bidirectionally Predicted Pictures) Ảnh B là ảnh mã hoá liên ảnh hai chiều. Tức là : + Có sử dụng bù chuyển động. + Dự báo không nhân quả, ảnh dự báo gồm các macroblock của cả khung hình trước đó và sau đó. Việc sử dụng thông tin lấy từ ảnh trong tương lai hoàn toàn có thể thực hiện được vì tại thời điểm mã hoá thì bộ mã hoá đã sẵn sàng truy cập tới ảnh phía sau. Ảnh B không được sử dụng làm ảnh tham chiếu tạo dự báo cho các ảnh sau. Hình 2.9: Nội suy bù chuyển động Khung dự báo (P) = Khung trước – Khung hiện hành + Vecto chuyển động Khung kề trước (n) Khung hiện hành (n+1) Vùng không bao phủ Dự báo bù chuyển động bù ảnh P Khung dự báo (B) = Khung trước – Khung hiện hành + Vecto chuyển động hai chiều Khung hiện hành (n) Vị trí nội suy Đường di chuyển của vật thể Khung kề trước (n-1) Khung kề sau (n+1) Dự báo bù chuyển động bù ảnh B Luận văn tốt nghiệp - 31 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận  Thứ tự truyền dẫn và thứ tự hiển thị ảnh: Chuỗi ảnh MPEG thường có cấu trúc IBBPBBPBBI nhưng thứ tự truyền dẫn và thứ tự hiển thị ảnh là khác nhau do khi tạo ảnh B cần thông tin từ cả khung quá khứ và tương lai. Như vậy có nghĩa, ảnh trong tương lai cần phải được truyền dẫn trước. Trong khi đó, lúc hiển thị phải theo đúng thứ tự nguồn. Để thực hiện điều này, lớp ảnh (Picture layer) của dòng dữ liệu MPEG có thông tin về số thứ tự ảnh để trợ giúp hiển thị. Hình 2.10: Thứ tự truyền dẫn và thứ tự hiển thị ảnh c) Tiêu chuẩn MPEG-1 MPEG-1 có phạm vi ứng dụng rộng rãi cho dạng thức CSIF (Common Source Intermediate Format). CSIF là một định dạng nguồn dữ liệu đầu vào của các bộ nén và giải nén (codec) do CCITT qui định phù hợp với hai dạng quét TV 525dòng/60Hz và 625dòng/50Hz. Dạng thức này gắn với cấu trúc lấy mẫu 4:2:0 được qui định như sau: CCIR - 601 525 CSIF- 525 4:2:0 CCIR - 601 625 CSIF - 625 4:2:0 Số điểm/dòng tích cực + Chói Y 720 352 720 352 + màu (CB, CR) 360 176 360 176 Tần số lấy mẫu Thứ tự khung góc F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 I1 B2 B3 P4 B5 B6 P7 B8 B9 I10 I1 P4 B2 B3 P7 B5 B6 I10 B8 B9 Thứ tự hiển thị Thứ tự truyền dẫn Luận văn tốt nghiệp - 32 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận + Chói Y 13.5 6.75 13.5 6.75 + màu (CB, CR) 6.75 3.38 6.75 3.38 Số dòng tích cực + Chói Y 480 240 576 288 + màu (CB, CR) 480 120 576 144 Tốc độ khung (Hz) 30 20 25 25 Tỉ lệ khung ảnh 4:3 4:3 4:3 4:3 Bảng 2.1: Dạng thức ảnh cơ bản của CSIF Như vậy đối với MPEG-1, dòng dữ liệu truyền hình chuẩn theo CCIR- 601 phải được biến đổi sang dạng CSIF bằng một bộ chuyển đổi (converter). Điều này được thực hiện bằng cách sử dụng bộ lọc dòng (horizontal decimation filter) cho tín hiệu chói mành lẻ và bộ lọc dòng và mành cho tín hiệu CR, CB mành lẻ. Quá trình giải mã tại bộ thu phải dự báo mành chẵn từ mành lẻ nội suy. Để giảm mức độ phức tạp và giá thành bộ giải mã, trong MPEG 1 một số tham số được mặc định thành hằng số như sau: Tham số Giá trị cực đại Độ rộng ảnh 768 điểm Chiều cao ảnh 576 dòng Tốc độ ảnh 30 ảnh/s Số lượng MB (Macroblock) 396 Giải vector chuyển động 64 điểm Kích thước bộ đệm đầu vào 327.680 bit Tốc độ bit 1,8 Mbps Bảng 2.2: Các tham số mặc định trong chuẩn MPEG-1 Cú pháp dòng bit gồm 6 lớp như đã mô tả ở bảng 2.3. Sử dụng cả hai dạng thức nén:  Nén Intra: Biến đổi DCT, lượng tử hoá, mã hoá VLC cho ảnh I.  Nén Inter: Ước lượng chuyển động, tạo dự báo có bù chuyển động cho ảnh B và ảnh P. MPEG 1 có một số tiêu chuẩn cơ bản như sau: Luận văn tốt nghiệp - 33 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận + Chỉ có một cấu trúc lấy mẫu 4:2:0. + Kích cỡ ảnh tối đa 720 pixel với 576 dòng sử dụng các tham số mặc định và cỡ 4095 x 4095 dùng tham số đầy đủ. + Độ chính xác mẫu đầu vào 8 bit. + Độ chính xác lượng tử hoá và DCT: 9 bit. + Sử dụng lượng tử hoá DPCM tuyến tính cho hệ số DC. + Lượng tử thích nghi cho lớp macroblock (16x16 điểm). + Độ chính xác cực đại của hệ số DC là 8 bit. + Ma trận lượng tử chỉ có thể thay đổi ở lớp chuỗi. + Sử dụng khung P và B. + Độ chính xác dự báo chuyển động là nửa điểm. + Tốc độ bit tối đa là 1,85 Mbps khi dùng tham số mặc định cho ảnh 720x576 và 100 Mbps khi dùng tham số đầy đủ cho ảnh 4095 x 4095. MPEG-1 cho phép có sự truy cập ngẫu nhiên các khung video, tìm kiếm nhanh thuận ngược theo dòng bit đã nén, phát lại ngược dòng video và khả năng dời bỏ dòng bit nén. d) Hệ thống nén MPEG-1 Bộ phân loại Inter/Intra căn cứ vào thông tin phân loại ảnh (I, P, B) sẽ cho tín hiệu ra Inter/Intra xác định ảnh được mã hóa theo mode Inter hay mode Intra. Thông tin này là tác nhân chuyển mạch kích hoạt bộ tạo dự báo tương ứng.  Nếu ảnh I (mã hóa Intra): Sử dụng dự báo Intra, lấy MB lân cận trước đó làm dự báo cho MB hiện hành. MB lân cận này được phục hồi nhờ bộ giải lượng tử và biến đổi DCT ngược (IDCT).  Nếu ảnh B, P (mã hóa Inter): Sử dụng bộ tạo dự báo Inter có bù chuyển động. Bộ tạo dự báo này hoạt động như sau:  Chuyển động của các MB được tính toán nhờ bộ ước lượng chuyển động theo các thuật toán Blocking Matching. Kết quả cho vector chuyển động.  Vector chuyển động này được đưa đến khối dự báo có bù chuyển động để tạo giá trị dự báo có bù chuyển động.  Do quá trình ước lượng chuyển động cần so sánh giữa khung hiện hành với khung quá khứ (ảnh P) hoặc với cả khung quá khứ lẫn tương lai (ảnh B) nên cần có hai bộ lưu trữ ảnh. Luận văn tốt nghiệp - 34 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận  Sai số giữa MB dự báo và hiện hành được biến đổi DCT, lượng tử hóa, mã hóa VLC rồi đưa tới bộ nhớ đệm. Đầu ra bộ nhớ đệm là dòng bit đã được mã hóa và có tốc độ ổn định.  Tham số lượng tử, thông tin phân loại Inter/Intra và vector chuyển động sẽ được ghép kênh với thông tin ảnh đưa tới bên thu phục vụ cho quá trình tạo dự báo và giải mã khôi phục ảnh. Sơ đồ khối chi tiết bộ codec (bộ mã hoá) trong chuẩn MPEG-1 như sau: Hình 2.11: Sơ đồ khối bộ mã hóa MPEG-1 Thông tin về loại ảnh (I,B,P) Bộ phân loại Inter_Intra DCT Bộ cảm nhận đặc tính mã hóa Mã hóa VLC và ghép kênh Bộ nhớ điệm Lượng tử hóa Lượng tử hóa thích Giải lượng tử ICDT Dự báo có bù chuyển động Ước lượng chuyển động Lưu trữ ảnh tương lai Lưu trữ ảnh quá khứ DCT: Biến đổi cosin rời rạc ICDT: Biến đổi cosin rời rạc ngược Loại ảnh (I,B,P) Loại ảnh (I,B,P) INTER/ INTRA Write Previous Write Future Vecto chuyển động INTER/ INTRA Tham số lượng tử Tham số lượng tử Vecto chuyển động Dòng video vào INTER/ INTRA Dòng bit Luận văn tốt nghiệp - 35 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Sơ đồ khối chi tiết bộ giải mã trong chuẩn MPEG-1 như sau: Hình 2.12: Sơ đồ khối bộ giải mã MPEG-1 Trong dòng bit truyền đi từ bên phát sẽ có thông tin ảnh gốc cũng như các tham số quy định bước lượng tử và vector chuyển động. Vector chuyển động này được bên thu sử dụng để tạo dự báo có bù chuyển động tương tự như phía phát. Giá trị sai số dự báo từ bên thu sau khi giải lượng tử và biến đổi DCT ngược được cộng với giá trị dự báo. Kết quả thu được ảnh cần hồi phục. 1.3.3 Nén video theo tiêu chuẩn MPEG-2 a) Tiêu chuẩn nén video MPEG-2 Tiêu chuẩn MPEG-2 còn được gọi là ISO/IEC 13818 là sự phát triển tiếp theo của MPEG-1 ứng dụng cho độ phân giải tiêu chuẩn của truyền hình do CCIR- 601 qui định. MPEG 2 gồm 4 phần: Phần 1: Hệ thống (ISO/IEC 13818-1): Xác định cấu trúc ghép kênh audio, video và cung cấp đồng bộ thời gian thực. Phần 2: Video (ISO/IEC 13828-2): Xác định những thành phần mã hóa đại diện cho dữ liệu video và phân loại xử lý giải mã để khôi phục lại khung hình ảnh. Phần 3: Audio (ISO/IEC 13818-3): Mã hóa và giải mã dữ liệu âm thanh. Phần 4: Biểu diễn (ISO/IEC 13818-4): Định nghĩa quá trình kiểm tra các yêu cầu của MPEG-2. Bộ nhớ đệm Giải mã và tách kênh Giải lượng tử hóa IDCT Lưu trữ ảnh tương lai Lưu trữ ảnh quá khứ Dự báo có bù chuyển động Dòng video ra Loại ảnh (I,B,P) Loại ảnh (I,B,P) Vecto chuyên động Tham số lượng tử Write Future Write Previous INTER/ INTRA Dòng bit Luận văn tốt nghiệp - 36 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận So với MPEG-1, MPEG-2 có nhiều cải thiện, ví dụ về kích thước ảnh và độ phân giải ảnh, tốc độ bit tối đa, tính phục hồi lỗi, khả năng co giãn dòng bit. Khả năng co giãn dòng bit của MPEG-2 cho phép khả năng giải mã một phần dòng bit mã hóa để nhận được ảnh khôi phục có chất lượng tuỳ thuộc mức độ yêu cầu. Sau đây là một số đặc điểm chủ yếu của tiêu chuẩn này :  Hỗ trợ nhiều dạng thức video, đặc biệt là các dạng thức video độ phân giải không gian cao, dạng thức video xen kẽ của truyền hình.  Cú pháp dòng bit MPEG-2 là sự mở rộng của dòng bit MPEG-1.  Nén video MPEG-2 tương hợp với nén video MPEG-1. Được thể hiện qua 4 hình thức tương hợp. + Tương hợp thuận: Bộ giải mã MPEG-2 có khả năng giải mã dòng bit (hoặc một phần dòng bit MPEG-1). + Tương hợp ngược: Bộ giải mã MPEG-1 có khả năng giải mã được một phần dòng bit MPEG-2. + Tương hợp lên: Bộ giải mã có độ phân giải cao có khả năng giải mã được dòng bit của bộ mã hoá có độ phân giải thấp. + Tương hợp xuống: Bộ giải mã co ù độ phân giải thấp có thể giải mã được một phần dòng bit của bộ mã hóa độ phân giải cao.  MPEG-2 hỗ trợ khả năng co giãn (scalability): Co giãn không giãn, co giãn SNR (Signal to Noise Ratio), co giãn phân chia số liệu, ...  Ngoài ra còn có nhiều cải tiến khác trong MPEG-2 bao gồm: + Cho phép nhiều cấu trúc lấy mẫu: 4:4:4, 4:2:2 và 4:2:0. + Hệ số DC được mã hóa với độ chính xác đặc biệt. + Bảng lượng tử riêng biệt cho các thành phần chói và màu nên lợi dụng được đặc điểm của mắt người ít nhạy cảm hơn với tín hiệu màu. + Cho phép cả hai dạng quét: Quét xen kẽ và quét liên tục. + Có khả năng hồi phục sữa lỗi.  Cú pháp đầy đủ của MPEG-2 được thể hiện qua các tập con gọi là profile, phù hợp với các lĩnh vực áp dụng. Mỗi profile lại bao gồm từ 1 đến 4 mức độ hạn chế về độ phân giải không gian, tốc độ bit. b) Cấu trúc dòng bit video MPEG-2 Dòng bit MPEG-2 về cơ bản tương hợp với MPEG-1, tức là cũng gồm cấu trúc 6 lớp tên gọi và chức năng các lớp được liệt kê lại như sau: Luận văn tốt nghiệp - 37 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Lớp Chức năng Lớp chuỗi (Sequence Layer) Đơn vị nội dung Lớp nhóm ảnh (GOP Layer) Đơn vị truy nhập ngẫu nhiên dòng video mã hóa. Lớp ảnh (Picture Layer) Đơn vị mã hóa cơ bản Lớp lát (Slice Layer) Đơn vị tái đồng bộ Lớp Macro Block (MB Layer) Đơn vị bù chuyển động Lớp khối (Block Layer) Đơn vị chuyển đổi DCT Bảng 2.3: Các lớp của cú pháp dòng bit MPEG-2  Lớp chuỗi là đại diện mã hóa cho một chuỗi ảnh (Video sequence).  Lớp nhóm ảnh cung cấp điểm truy cập ngẫu nhiên. Ảnh bắt đầu của chuỗi bao giờ cũng là một ảnh I. Ảnh I này cung cấp điểm truy cập vào dòng bit mã hóa.  Lớp lát có chức năng hồi phục đồng bộ. Khi dòng bit có lỗi, bộ giải mã có thể bỏ qua slice có lỗi và bắt đầu bằng một slice mới. Mỗi lát chứa một hoặc một số MB.  Mỗi macroblock (MB) là một đơn vị được ước lượng chuyển động và có vector chuyển động riêng trong phần header của nó.  Lớp khối là lớp thấp nhất. Mỗi khối là một đơn vị DCT gồm 64 hệ số (một hệ số DC và 63 hệ số AC phép chuyển đổi cosine rời rạc) của khối ảnh I hoặc khối sai số dự báo (ảnh P, B). So với MPEG-1, cú pháp dòng bit MPEG-2 có thêm một số chức năng mở rộng. Do đó có 2 hướng đi trong dòng bit MPEG-2 như hình vẽ dưới đây: hoặc theo quy trình MPEG-1 hoặc theo các chức năng mở rộng riêng của MPEG-2. Hình 2.13: Cú pháp dòng bit MPEG-2 c) Khả năng co giản của MPEG-2 Một trong những đặc điểm quan trọng nhất của MPEG-2 là sự phù hợp với nhiều ứng dụng video. Có thể sử dụng MPEG-2 cho phân phối truyền hình tiêu chuẩn (Standard Television), truyền hình phân giải cao (High Definition Television) hoặc cho truyền dẫn tín hiệu truyền hình thông qua các mạng truyền thông. Sequence headend (đầu đề chuỗi) Dòng bit MPEG-1 ISO/IEC 11172-2 xtended Sequence (chuỗi mở rộng) Luận văn tốt nghiệp - 38 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Tính co giãn của dòng bit MPEG-2 là khả năng giải mã được một phần dòng bit MPEG-2 độc lập với phần còn lại của dòng bit đó nhằm khôi phục video với chất lượng hạn chế (hạn chế độ phân giải không gian, độ phân giải thời gian hoặc hạn chế về SNR...). Dựa theo tính co giãn, dòng bit được phân thành hai hay nhiều lớp. Tập con nhỏ nhất của cú pháp dòng bit có thể giải mã một cách độc lập được gọi là lớp cơ bản. Các lớp còn lại được gọi là các lớp nâng cao. Có nhiều loại co giãn khác nhau như:  Co giãn không gian: Dòng bit gồm hai hay nhiều lớp video có độ phân giải không gian khác nhau.  Co giãn SNR: Dòng bit gồm hai hay nhiều lớp video có cùng độ phân giải không gian nhưng tỉ số tín hiệu trên nhiễu SNR là khác nhau.  Co giãn thời gian: Dòng bit gồm hai hay nhiều lớp video có cùng độ phân giải không gian nhưng có độ phân giải thời gian khác nhau.  Co giãn phân chia số liệu: Dòng bit video được chia làm hai phần. Phần ưu tiên cao (lớp cơ bản) gồm các hệ số DCT tần số thấp, phần ưu tiên thấp (lớp nâng cao) gồm các hệ số DCT tần số cao. Co giãn phân chia số liệu chính là một dạng cơ bản của co giãn tần số. Tiêu chuẩn MPEG-2 đã qui định chính thức hai loại co giãn: co giãn không gian và co giãn SNR. Các loại co giãn khác chỉ mới ở dạng dự thảo. d) Profile và Level của MPEG-2 Phạm vi ứng dụng của MPEG-2 rất rộng. Mỗi ứng dụng đòi hỏi mức độ phức tạp khác nhau. Bởi vậy, MPEG-2 định nghĩa các mức (level) và các tập con (profile) phù hợp cho từng lĩnh vực áp dụng. Profile xác định cú pháp dòng bit và level xác định các tham số hạn chế độ phân giải không gian, tốc độ bit. Có 4 mức: low (thấp), main (chính), high-1440 (cao-1440) và high (cao). Kích cỡ ảnh quy định bởi 4 mức tương ứng sau: Level Cỡ khung Low 352x288 (bằng 1/4 cỡ ảnh SDTV) Main 720x576 (cỡ chuẩn SDTV) High-1440 1440x1152 (cỡ HDTV) High 960x576 hoặc 1920x1152 Bảng 2.4: Mức ảnh trong MPEG-2 Có 5 profile là: Simple (đơn giản), Main (chính), SNR scalable (co giãn SNR), Spatial scalable (có khả năng co giãn không gian) và High profile. Tổng cộng có 12 tổ hợp profile, level. Trong đó: Luận văn tốt nghiệp - 39 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận  MP @ ML (Main profile @ Main level): Lấy mẫu 4:2:0 Độ phân giải: 720*576 Tốc độ bit: 15Mbps Dạng ảnh: I, P, B Ứng dụng vào việc số hóa truyền hình tiêu chuẩn (Standard television).  MP @ HL (Main profile @ High level): Lấy mẫu 4:2:0 Độ phân giải: 1920x1152 Tốc độ bit: 80Mbps Dạng ảnh sử dụng: I, P, B Ứng dụng vào HDTV (truyền hình số có độ phân giải cao).  Sau này có bổ sung 4:2:2 P @ ML (4:2:2 Profile @ Main level) áp dụng vào lĩnh vực sản xuất chương trình truyền hình (studio) vì các lý do sau: + Chất lượng cao: Độ phân giải màu tốt hơn so với MP @ ML (lấy mẫu 4:2:0), chất lượng tổng quát cao hơn do sử dụng tốc độ bit lớn hơn. + Có khả năng sao chép nhiều lần mà vẫn đảm bảo chất lượng y như video gốc. + Tính linh hoạt: Nhóm anh (GOP) ngắn hơn nên thuận tiện cho việc dàn dựng, biên tập chương trình truyền hình. + Tính kinh tế: Giá thành lưu trữ và truyền dẫn giảm, có khả năng tương hợp giữa các thiết bị của nhiều hãng sản xuất khác nhau. Các tham số cơ bản của 4:2:2 P @ ML: Cấu trúc lấy mẫu: 4:2:2 Độ phân giải ảnh: 720*576 Tốc độ dòng bit: 20Mbps Dạng ảnh sử dụng: I, P, B 2. Công nghệ ghép kênh Ngày nay, việc sử dụng phổ tần số ngày càng được chú trọng. Vì phổ tần số là tài sản hữu hạn của quốc gia phục vụ nhiệm vụ thông tin liên lạc ngày càng phát triển không ngừng của xã hội, cũng như phục vụ cho việc phát triển kinh tế xã hội, an ninh quốc phòng. Việc sử dụng tần số một cách tiết kiệm và có hiệu quả là ưu tiên hàng đầu. Ghép kênh là ghép nhiều luồng tín hiệu lại với nhau thành một luồng duy nhất, nhằm tiết kiệm kênh truyền. Có hai phương pháp ghép kênh số: Luận văn tốt nghiệp - 40 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận  Ghép kênh phân chia theo thời gian (TDM - Time Division Multilexing Method). Về nguyên lý TDM gán các khe thời gian một cách tuần hoàn cho các dòng sơ cấp audio, video và số liệu. Hình 2.14: Ghép kênh theo thời gian  Ghép kênh gói (Packet Multiplexing Method). Trong cách ghép kênh gói, các gói số liệu từ các dòng sơ cấp audio, video, số liệu được đan xen vào nhau một cách tuần hoàn hoặc không tuần hoàn, gói này tiếp theo gói kia để hình thành một dòng ghép kênh. Hình 2.15: Ghép kênh gói 2.1 Hệ thống ghép kênh video số theo tiêu chuẩn MPEG-2 2.1.1 Ghép kênh gói theo chuẩn MPEG Hình 2.16: Bộ ghép kênh MPEG-2 Hệ thống ghép kênh gói mô tả cách thức các dòng số video nén, audio nén và các dòng số liệu khác được ghép chung lại với nhau để tạo ra dòng ghép kênh MPEG. Một số thuật ngữ và các nguyên lý cơ bản của các lớp hệ thống MPEG: V4 V3 V2 V1 A4 A3 A1 D4 D2 D1 A3 V3 D2 V2 D1 A1 V1  Framer TS3 TS2 TS1 MULTIPLEXER Dòng sơ cấp chương trình #1 Dòng sơ cấp chương trình #2 Dòng sơ cấp chương trình #n Số liệu riêng Thông tin dịch vụ Điều kiển truy cập có điều kiện Dòng ghép kênh MPEG-2 BỘ GHÉP KÊNH MPEG-2 V3 V2 V1 A3 A2 A1 D3 D2 D1 Framer MULTIPLEXER V1 A1 D1 V2 A2 D2 V3 A3 D3 Luận văn tốt nghiệp - 41 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận  Chương trình (Program): Theo ngôn ngữ phát thanh truyền hình thì chương trình thường có nghĩa là các tiết mục thông tin, giáo dục, giải trí, … được các đài phát lên sóng hàng ngày. Trong ngữ nghĩa của MPEG, thuật ngữ chương trình có nghĩa là một kênh (channel) hay một dịch vụ phát sóng (broadcast service) đơn. Theo nghĩa này thì VTV1, VTV2, HTV7, … là các chương trình.  Dòng sơ cấp ES (Elementary Stream): Một chương trình bao gồm một hay nhiều dòng sơ cấp. Chương trình truyền hình thông thường bao gồm ba dòng sơ cấp đó là: dòng video, dòng audio và dòng số liệu teletex.  Dòng ghép kênh: Lớp hệ thống MPEG-2 mô tả cách thức các dòng sơ cấp của một chương trình hay của nhiều chương trình được ghép chung với nhau tạo thành một dòng số liệu thích hợp cho lưu trữ số, hay truyền dẫn số.  Các thông tin cần thiết khác: + Hệ thống các nhãn thời gian (Tim Stamp - TS): Sử dụng để đảm bảo các dòng sơ cấp liên hệ với nhau được phát lại một cách đồng bộ tại bộ giải mã. + Các bảng thông tin dịch vụ (Service Imformation): Mô tả chi tiết về thông số mạng, về các chương trình được ghép kênh và về bản chất của các dòng sơ cấp khác nhau. + Các thông tin điều kiển việc xáo trộn (Scrambling) số liệu, các thông tin dùng để truy cập có điều kiện CA (Conditional Access). + Các kênh số liệu riêng (Private Data): Số liệu riêng là dòng số liệu mà nội dung của nó không được quy định bởi chuẩn MPEG. + Ở MPEG, để đạt được sự đồng bộ thông qua việc sử dụng nhãn thời gian tần số và chuẩn đồng hồ (Clock System CS). CS là mẫu data 33 bit chỉ báo thời gian theo đồng hồ thời gian hệ thống (System Time Clock STC) của một đơn vị trình diễn (Presentation Unit PU: ảnh, video, audio, …) nào đó. 2.1.2 Hệ thống ghép kênh MPEG-2 Hình 2.17: Hệ thống ghép kênh MPEG-2 Mã hoá video Mã hoá audio Đóng gói Đóng gói Ghép kênh dòng chương trình Ghép kênh dòng truyền tải Video vào Audio vào Dữ liệu Dòng chương trình Dòng truyền tải Luận văn tốt nghiệp - 42 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Hệ thống ghép kênh MPEG-2 được chia thành 2 hệ thống: Hệ thống ghép kênh dòng chương trình và hệ thống ghép kênh dòng truyền tải. Bộ mã hóa video mã hóa tín hiệu video số định dạng CCIR-601 thành dòng sơ cấp video (video ES) có chiều dài gần như vô tận và chỉ chứa thông tin tối cần thiết để có thể khôi phục lại hình ảnh ban đầu. Bộ mã hóa audio mã hóa tín hiệu audio số định dạng AES/EBU thành dòng sơ cấp audio có chiều dài tùy ý (tần số lấy mẫu 48KHz, lượng tử hóa 24 bit và tốc độ bit là 1152Kbps). Để có thể truyền được với tốc độ cao, các dòng video, audio được đóng gói lại thành các dòng sơ cấp PES (Packetized Elementary Stream) tương ứng với các gói có độ dài thay đổi. Mỗi gói PES bao gồm một header và một số liệu trích ra từ dòng sơ cấp. Các gói PES lại được ghép với nhau tạo ra dòng chương trình (PS - Program Stream) hay dòng truyền tải (TS - Transport Stream). Hình 2.18: Hệ thống cấu trúc các lớp MPEG Trong hệ thống MPEG-2 có 2 lớp:  Lớp nén: Mô tả cú pháp của dòng video và audio dựa trên cấu trúc dòng data video và audio (đã trình bày trong phần trước). Các chuỗi data video và audio độc lập được mã hóa MPEG-2 để tạo ra các dòng độc lập gọi là dòng cơ bản.  Lớp hệ thống: Định nghĩa tổ hợp của các dòng bit audio và video riêng biệt thành một dòng đơn để lưu trữ (dòng chương trình PS) hay để truyền tải (dòng truyền tài TS). Hệ còn gồm các thông tin định thời và thông tin khác cần cho giải đa hợp dòng audio, video và để đồng bộ audio-video ở phía giải mã; thông tin chuẩn đồng hồ hệ thống (System Clock Reference - SCR) và nhãn thời gian trình diễn (Presentation Time Stamp - PTS) được chèn vào dòng bit MPEG. Định dạng nguồn Mã hoá nén Đóng gói Đa hợp dòng TS Đa hợp dòng PS Giải định dạng nguồn Giải mã nén Mỡ gói Giải đa hợp dòng TS Giải mã đa hợp dòng PS Lớp nén Lớp hệ thống Tín hiệu video, audio, dữ liệu Luận văn tốt nghiệp - 43 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Chuẩn MPEG định nghĩa một hệ thống ba dòng data có thứ bậc như sau: dòng sơ cấp đã đóng gói, dòng chương trình và dòng truyền tải.  Dòng sơ cấp đóng gói (PES): Qua bộ đóng gói, dòng sơ cấp được chia thành các gói có độ dài tùy ý. Nội dung gói có nguồn gốc từ dòng data hay dòng audio hay dòng video đã được mã hóa MPEG-2. Hình 2.19: Cấu trúc PES  Dòng chương trình (PS - Program Stream): Các gói PES có nguồn gốc từ 1 hay nhiều dòng sơ cấp dùng chung gốc thời gian như là dòng audio, video, data, được ghép thành một dòng chương trình PS như các lô (pack) có tính lặp lại. Trong phần header của lô, SCR đảm bảo các gói audio và video được định thời. Đó là tín hiệu thời gian thực chỉ báo thời gian truyền trong lo đó. Các lô PS có độ dài tùy ý. Số lượng và trình tự các gói trong lô không được định nghĩa, nhưng các gói được gởi theo trình tự thời gian. Một PS có thể mang tới 32 dòng audio, 16 dòng video, 16 dòng data; tất cả đều có chung gốc thời gian. PS nhạy với lỗi và được dùng ghi hình đa phương tiện và phân phối nội bộ, trong các ứng dụng có sai số truyền có thể bỏ qua được.  Dòng truyền tải (TS - Transport Stream): Có thể được tạo thành từ một tổ hợp 1 hay nhiều dòng PS có gốc thời gian độc lập nhau hoặc từ một tổ hợp các PES. Tuy nhiên, PS không phải là một bộ con của TS, do TS không chứa tất cả thông tin trên thì các gói PES có nguồn gốc từ một hay nhiều dòng sơ cấp ES dùng chung gốc thời gian hay gốc thời gian khác nhau như dòng audio, video và data được ghép hợp thành một dòng truyền tải TS gồm các gói truyền tải có kích cỡ nhỏ mang tính lặp lại. Một hay nhiều PS có clock chuẩn khác nhau cũng có thể được ghép hợp thành một TS qua sự chuyển đổi trong gói PES. Các gói TS có chiều dài cố định 188 byte và nội dung data của chúng. Chúng mang thông tin định thời, thông tin đồng bộ và cơ chế sữa jitter để bảo đảm truyền tải khoảng cách xa tin cậy được. Hơn nữa, kích cỡ gói data cố định cho phép chuyển đổi TS thành các tế bào mạng ATM (Asynchronous Tranfer Mode). Dòng này có sức đề kháng với lỗi nên được chỉ định cho các ứng dụng có sai số không thể bỏ qua được. 8 byte Phần payload ES (lớn nhất 8x210 – 8 = 8184 byte) SC SC SC SI PL BS BS PL Tên Số byte Mục đích SC 3 Mã bắt đầu SI 1 Nhận dạng dòng PL 2 Độ dài gói BS 2 Kích cỡ bộ đệm Luận văn tốt nghiệp - 44 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Hình 2.20: Cấu trúc gói dòng truyền tải TS Hình 2.21: Định dạng dòng truyền tải MPEG-2 Dòng sơ cấp video Dòng truyền tải đa chương trình Chuỗi Audio # n-1 Chuỗi Audio # n Chuỗi Audio # n+1 Video Audio Video Video Audio Video Audio2 Audio1 Dư liệu Video Audio Chuỗi Video # n-1 Chuỗi Video # n Chuỗi Video # n+1 Gói PES (độ dài thay đổi, lớn hơn 64 Kbit) 188 byte Dòng chương trình #1 Dòng chương trình #2 Dòng chương trình #3 Gói PES (độ dài thay đổi, lớn hơn 64 Kbit) 188 byte/gói Dòng sơ cấp video đã đóng gói Các gói truyền tải video Dòng sơ cấp audio Dòng sơ cấp audio đã đóng gói Các gói truyền tải audio 1 188 byte/gói Số liệu truyền tải 1 byte 3 byte điều kiển 4 byte 184 byte Gói có độ dài 188 byte Phần header của gói TS Phần header thích nghi có độ dài thay đổi Byte đồng bộ Luận văn tốt nghiệp - 45 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận 2.1.3 Ghép kênh dòng chương trình (Program Stream Mux) Một dòng chương trình là kết quả ghép kênh một vài dòng cơ sở đóng gói sử dụng cùng một hệ thống xung nhịp thời gian. Chương trình có thể là một dòng video có kèm audio hoặc một chương trình nhiều kênh audio. Hình 2.22: Ghép kênh dòng chương trình PS Dòng video cơ sở được chia thành các đơn vị truy cập (AU-Access Units). Mỗi AU chứa dữ liệu đã được nén của một ảnh. Các ảnh này được phận biệt bởi ảnh I, P hoặc B. Mỗi video AU là một gói chương trình (Program Stream Packet), các gói này thay đổi về kích thước. Ví dụ gói ảnh I lớn hơn nhiều gói ảnh B. Tuy nhiên đối với các đơn vị truy cập audio số (DAA-Digital Audio Access) thường có cùng kích thước và vài DAA tạo thành một gói dòng chương trình. Hình 2.23: Dòng chương trình Dòng chương trình được thiết kế để truyền trong môi trường không có tạp nhiễu và sai nhầm, ví dụ như trong các ứng dụng CD – ROM vì 2 nguyên nhân sau:  Dòng chương trình bao gồm các gói tương đối dài nối tiếp nhau và độ dài này lại luôn thay đổi. Mỗi gói bắt đầu bằng một tiêu đề (header). Mỗi lỗi xảy ra trong phần tiêu đề có thể làm mất thông tin của toàn gói vì các gói của chương trình có thể chứa vài chục Kbyte số liệu nên sự mất mát thông tin của một gói có thể làm mất hoạt gián đoạn cả một khung ảnh.  Độ dài gói không cố định khiến cho bộ giải mã không dự đoán được khi nào gói chấm dứt và khi nào gói mới bắt đầu. Thay vào đó, bộ giải mã đọc và dịch lại toàn bộ thông tin về độ dài gói chứa trong mỗi tiêu đề, nếu thông tin về độ dài gói này bị lỗi, bộ giải mã sẽ mất đồng bộ và như vậy sẽ làm mất thông tin ít nhất là một gói. Vì môi trường truyền dẫn phát sóng mà chúng ta quan tâm luôn có tạp nhiễu và sai nhầm, do đó không thể dùng dòng chương trình được mà phải dùng dòng truyền tải. Audio Video Audio Gói PES PES header Program stream MUX Video PES Audio PES Program stream (PS) Luận văn tốt nghiệp - 46 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận 2.1.4 Ghép kênh dòng truyền tải (Tranpost Stream Mux) Hình 2.24: Dòng truyền tải Nếu chia các gói PES có độ dài khác nhau thành các gói TS có độ dài không đổi (thường có chiều dài 188 byte) và truyền các gói này đi sau khi đã cộng với dòng bit điều khiển dùng để mô tả chương trình. Hình 2.25: Ghép kênh dòng truyền tải Trong dòng truyền tải, các gói PES từ các dòng sơ cấp khác nhau được phân nhỏ và gán vào phần payload của gói tần số. Quy trình này phải thỏa mãn 2 điều kiện:  Byte đầu tiên của mỗi gói PES phải trở thành byte đầu tiên của payload của gói TS.  Bất kỳ gói TS nào cũng chỉ mang phần dữ liệu lấy từ cùng một gói PES. Mỗi gói PES không thể phân chia dữ liệu của nó một cách chính xác vào một số nguyên gói TS. Thường gặp trường hợp không đủ số liệu để lắp đầy vào payload của gói TS cuối cùng. Để thỏa mãn 2 điều kiện trên, người ta độn thêm vào phần adaptaion field với độ dài thích hợp. Có thể giảm tối thiểu độ dài phần adaptaion field này bằng cách lựa chọn chiều dài gói PES hợp lý. Gói PES cũng thường được chọn đủ dài để đa số các gói TS được lắp đầy bởi số liệu có ích lấy từ các gói PES. Tất cả các gói sơ cấp PES ghép kênh chung với nhau tạo nên 1 hay nhiều chương trình sẽ được chuyển thành các gói TS theo cùng một cách thức như trên. Các gói TS sẽ được sắp xếp từng tự tạo ra dòng truyền tải. Các gói TS chứa thông tin dịch vụ cũng như các gói TS rỗng được sử dụng để lắp đầy kênh truyền. Thứ tự các gói TS có thể sắp xếp tùy ý miễn sao đảm bảo được điều kiện các gói TS của cùng một dòng sơ cấp đóng gói PES sẽ được truyền theo thứ tự thời gian. Audio Gói TS PES header Video Audio Video Audio Video PES header PID 1 Dòng truyền tải GHÉP KÊNH DÒNG TRUYỀN TẢI PID 2 PID (n -3) PID (n -2) PID (n -1) PID (n) Video PES Video PES Audio PES Audio PES Data Dòng ánh xạ cơ sở Luận văn tốt nghiệp - 47 - Thiết kế headend SD, HD GVHD: ThS. Phan Thanh SVTH: Tống Hồ Phú Thuận Hình 2.26: Chia các gói PES thành các gói TS a) Cấu trúc dòng truyền tải Hình 2.27: Cấu trúc gói truyền tải Gói truyền tải có kích thước cố định và bằng 188 byte, chia thành dữ liệu tiêu đề (header) và dữ liệu có ích (payload). Dữ liệu tiêu đề có độ dài tối thiểu bằng 4 byte chứa các thông tin sau:  Sync byte (8 bit): Byte đồng bộ mang giá trị không đổi bằng 0x47 không phải là giá trị duy nhất trong gói TS và có thể xuất hiện trong các trường của gói TS. Tuy nhiên, hiện tượng sync byte lặp đi lặp lại 188 Kbyte cùng với giá trị 0x47 của nó sẽ tạo cơ sở để nhận dạng chỗ bắt đầu của một gói TS mới.  Transpost error indication (1 bit): Bit này dùng để báo hiệu có lỗi gói xảy ra trên đường truyền – khi tỉ lệ sai nhầm bit (BER –Bit Error Rate) vượt quá giá trị cho phép từ khâu điều chế đến khâu giải điều chế, phân kênh. Giá trị 1 chỉ thị rằng đang có lỗi không thể sửa chữa được trong gói TS hiện hành, vì vậy không nên sử dụng phần payload trong gói TS này. Header Payload Header Payload Header Payload …… Sync byte (8 byte) Transport error indicator (1 bit) Start indicator (1 bit) Transport priority (1 bit) PIP (13 bit) Scrambling contro (2 bit) Adaptation field control (2 bit) Continuity counter (4 bit) Adaptati -on field Payload (n1 byte) Discontinuity indicator (1 byte) Random access indicator (1 bit) 5 flags (1 bit) Optional Field (1 bit) Stuffing byte (n2 ) Adaptation field lenghth (8 bit) OPCR (42 bit) Splice countdown (8 bit) Transport private data (8+n3) Adaptation field extension (8 + n4) PCR (42 bit) 188 byte Adaptation field Payload PES Header

Các file đính kèm theo tài liệu này:

luan_van_tot_nghiep.pdf