Ngôn ngữ lập trình Assembly

Tài liệu Ngôn ngữ lập trình Assembly: Bài 1 : Mở đầu I. Giới thiệu về Assembly Language (Hợp ngữ) 1. Giới thiệu về Assembly Language (Hợp ngữ) Việc lập trình bằng ngôn ngữ máy đòi hỏi người lập trình cần phải nhớ các mã lệnh bằng số, phải sắp đặt vị trí của mã lệnh và tất cả các số liệu trong bộ nhớ của máy tính, ngay cả các số liệu cũng phải viết dưới dạng số. Công việc này hết sức nặng nhọc và rất dễ gây nhầm lẫn. Chính vì vậy người ta cần đến Assembly Language, nó cho NSD các khả năng sau: Cho phép dùng các ký hiệu gợi nhớ thay cho các mã lệnh bằng số của bộ VXL, ví dụ ADD thay cho 00000000; INT 13h thay cho 11001101 00010011 .v.v... các ký hiệu loại này được gọi là mã lệnh (Op-Code). Cho phép dùng các tên gọi (nhãn: Label) để chỉ các địa chỉ nhớ, NSD gọi đến các tên này như việc gọi các thủ tục hoặc như là việc truy nhập đến các biến hay hằng số trong các ngôn ngữ lập trình bậc cao. Cho phép dùng các chỉ thị cho chính Assembler (Assembler Directive), để nó biết cần phải chuyển các mã của NSD như thế nào,...

doc59 trang | Chia sẻ: hunglv | Lượt xem: 3055 | Lượt tải: 3download
Bạn đang xem trước 20 trang mẫu tài liệu Ngôn ngữ lập trình Assembly, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Bài 1 : Mở đầu I. Giới thiệu về Assembly Language (Hợp ngữ) 1. Giới thiệu về Assembly Language (Hợp ngữ) Việc lập trình bằng ngôn ngữ máy đòi hỏi người lập trình cần phải nhớ các mã lệnh bằng số, phải sắp đặt vị trí của mã lệnh và tất cả các số liệu trong bộ nhớ của máy tính, ngay cả các số liệu cũng phải viết dưới dạng số. Công việc này hết sức nặng nhọc và rất dễ gây nhầm lẫn. Chính vì vậy người ta cần đến Assembly Language, nó cho NSD các khả năng sau: Cho phép dùng các ký hiệu gợi nhớ thay cho các mã lệnh bằng số của bộ VXL, ví dụ ADD thay cho 00000000; INT 13h thay cho 11001101 00010011 .v.v... các ký hiệu loại này được gọi là mã lệnh (Op-Code). Cho phép dùng các tên gọi (nhãn: Label) để chỉ các địa chỉ nhớ, NSD gọi đến các tên này như việc gọi các thủ tục hoặc như là việc truy nhập đến các biến hay hằng số trong các ngôn ngữ lập trình bậc cao. Cho phép dùng các chỉ thị cho chính Assembler (Assembler Directive), để nó biết cần phải chuyển các mã của NSD như thế nào, chương trình bắt đầu ở đâu; dự trữ khoảng trống bao nhiêu cho dữ liệu; báo rằng không còn lệnh để chuyển mã ngữ tiếp nữa .v.v. Ví dụ ORG 100h: đoạn mã lệnh bắt đầu ở địa chỉ 100h,Code_seg: segment: tên Code_seg là đại diện cho 1 segment trong bộ nhớ end: hết mã ngữ. Cho phép viết các chú thích trong chương trình, làm cho chương trình dễ đọc, dễ bảo trì. Khi hợp dịch, các mã lệnh được chuyển trực tiếp thành các lệnh của bộ vxl để nó có thể thực hiện trực tiếp được. Các nhãn, các chỉ thị cho Assembler chỉ được chính Assembler sử dụng, không chuyển thành mã máy; còn các chú thích (comment) thì bị bỏ qua. Chính vì vậy mà các chương trình viết bằng Assembly rất ngắn gọn, chạy rất nhanh. Chương trình được viết bằng các ký hiệu của ngôn ngữ Assembly được gọi là chương trình nguồn (Source Program). Chương trình ở dạng số tương tương với chương trình nguồn mà bộ VXL có thể hiểu được (microprocessor-compatible form) gọi là chương trình đích(Object Program). Assembler là chương trình thực hiện chuyển (convert) chương trình nguồn(Source Program) thành chương trình đích (Object Program). 2. Một số vấn đề về hệ đếm 2, số có dấu, số bù 2 2.1 Hệ đếm 2 Như ta đã biết, các phần tử nhớ cơ bản cấu tạo nên bộ nhớ cũng như các phần tử trong khối tính toán của máy tính đều là các phần tử có 2 trạng thái cân bằng ổn định 'on' và 'off' (ta có thể dùng để biểu diễn số 1 và 0) giống như trạng thái đóng mạch và cắt mạch của một cái công tắc điện. Tất cả chương trình và số liệu mà chương trình sử dụng đều đặt trong bộ nhớ trước khi được bộ VXL đọc. Như vậy sự kết hợp của một dãy các số 0 và 1 có thể biểu diễn bất cứ con số nào. Hệ đếm chỉ sử dụng các số 0 và 1 được gọi là hệ nhị phân (Binary numbering system) hay hệ đếm 2 , đó là hệ đếm cơ sở cho mọi loại MTĐT ngày nay. Một phần tử nhớ chỉ có 1 trong hai giá trị 0, 1 được gọi là 1 bit, đó là chữ viết tắt của Binary digit. Cũng tương tự như trong hệ thập phân, trong một số nhị phân giá trị của mỗi bit trong con số phụ thuộc vào vị trí của nó trong con số đó như được thể hiện sau đây: 7 6 5 4 3 2 1 0 vị trí bit trong con số x x x x x x x x 27 26 25 24 23 22 21 20 trọng số của bit 128 64 32 16 8 4 2 1 giá trị tương ứng trong hệ thập phân Để chuyển một số từ hệ thập phân sang hệ nhị phân ta thực hiện một loạt các phép MOD 2 đối với số đó cho tới khi số thập phân bằng 0: Giá trị của phép tính MOD 2 đầu tiên là giá trị của bit 0 Giá trị của phép tính MOD 2 tiếp theo là giá trị của bit 1.v.v... Trong các lĩnh vực tin học, thường sử dụng một đơn vị lớn hơn, đó là byte, 1 byte gồm 8 bit, như vậy 1 byte có thể biểu diễn một con số có giá trị từ 00000000 đến 11111111 (0 - 255 trong hệ thập phân). Ngoài ra còn có các đơn vị 1KB = 210 byte, 1MB = 220 byte ... 2.2 Số có dấu Khi sử dụng 1 byte để biểu diễn số có dấu, người ta chỉ sử dụng 7 bit thấp để biểu diễn số, còn bit cao nhất (bit 7) để biểu diễn dấu của con số đó, nếu bit này = 0 thì con số là dương, nếu bit này = 1 thì con số là âm. Như vậy với 1 byte có thể biểu diễn các số từ -128 đến +127. Theo quy ước này số -1 có giá trị như sau: 10000001 nếu ta đem cộng với 1 thì kết quả lại = 10000010 = -2D! không như chúng ta chờ đợi là = 0; chính vì lý do này mà người ta phải dùng một dạng số đặc biệt - dạng bù 2 (two's complemented) để biểu diễn số âm. Để tìm dạng biểu diễn nhị phân của một số âm (nghĩa là tìm dạng bù 2 của nó), ta chỉ việc lấy số dương tương ứng rồi đảo giá trị các bit, sau đó cộng 1 vào kết quả là xong. Thí dụ tìm biểu diễn nhị phân của số -1: 0000 0001 đảo các bit thành 1111 1110, đem cộng thêm 1 trở thành 1111 1111.Nếu ta đem số -1 này cộng với +1 thì kết quả là 1 0000 0000, ta lờ số nhớ (1) đi thì được số 0000 0000 như mong muốn! đó là cách biểu diễn số âm trong máy tính! Nhìn vào số âm dạng bù 2 ta khó mà hiểu được số thập phân (âm) tương ứng bằng bao nhiêu, nếu muốn tính, ta vẫn áp dụng quy tắc trên để tính được số dương tương ứng.Thí dụ muốn biết 1101 0000 có giá trị thập phân tương ứng bằng bao nhiêu? Đảo các bit 0010 1111 Cộng thêm 1 = 0000 0001 Kết quả = 0011 0000 = 32 + 16 = +48 , số thập phân tương ứng là -48 2.3. Hệ đếm thập lục phân (hệ 16) Biểu diễn số trong hệ cơ số 2 có nhiều điểm bất tiện cho người lập trình, vì vậy người ta tìm cách biểu diễn khác cho tiện lợi hơn, tuy vậy cần phải nhấn mạnh rằng bên trong máy tính tất cả lệnh và số liệu đều được biễu diễn dưới dạng nhị phân. Ngay từ khi máy tính điện tử mới ra đời, người lập trình cũng đã thường thao tác trên từng nhóm bit chứ không phải trên từng bit. Các bộ VXL đầu tiên là loại 4 bit, vì thế người ta có thể nhóm 4 bit lại và biểu diễn bằng một ký hiệu duy nhất. Với 4 bit có thể biểu diễn 16 giá trị khác nhau, người ta dùng các ký hiệu 0..9, A, B, C, D, E, F để biểu diễn các giá trị nhị phân từ 0000 đến 1111. Hệ đếm như vậy được gọi là hệ thập lục phân (hệ đếm cơ số 16) - hexadecimal numbering system. 3. Một số vấn đề cần nhắc lại (sau giáo trình CTMT) về bộ VXL Các Mode làm việc: Các bộ VXL 80286 (và các bộ VXL mới hơn của INTEL) có thể hoạt động trong 2 mode khác nhau: Real Address Mode và Protected Virtual Address Mode. Real Address Mode : Trong Mode này 80286 hoạt động cũng giống như 8086, nhưng thực hiện các chương trình nhanh hơn từ 2 đến 5 lần, nó hỗ trợ tất cả các lệnh của 8086, thêm vào đó là các lệnh của riêng 80286. Khi chúng ta mới bật máy, 80286 bắt đầu ở Mode này, chỉ khi nào chương trình ra lệnh cho nó chuyển sang Mode kia (Protected Mode). Protected Mode : Trong Mode này 80286 vẫn có mọi tính năng như ở Real Address Mode nhưng được thêm vào một số tính năng tinh vi để bảo vệ dữ liệu và quản lý bộ nhớ. Tính năng nổi bật nhất của Mode này là nó cho phép 80286 truy cập một bộ nhớ rất lớn (so với 8086) bằng cách sử dụng một kỹ thuật gọi là Virtual Addressing.Bằng kỹ thuật này 80286 có thể làm việc với 2 loại bộ nhớ: không gian địa chỉ vật lý (Physical address space) và không gian địa chỉ ảo (Virtual address space). Không gian địa chỉ vật lý là miền bộ nhớ mà 80286 có thể làm việc với nó tại một thời điểm, bằng 224 = 16MB Không gian địa chỉ ảo là miền bộ nhớ mà 80286 có thể đánh địa chỉ, bằng 230 = 1GB (1 Giga byte). Thuật ngữ ảo (Virtual) được sử dụng bởi vì nếu một chương trình cần truy cập bộ nhớ mà địa chỉ không thuộc không gian địa chỉ nhớ vật lý, hệ điều hành có thể sử dụng khả năng quản lý bộ nhớ của 80286 để chuyển đổi (swap) một phần thích hợp (applicable piece) của bộ nhớ ảo. Việc chuyển đổi bộ nhớ (swapping) này người lập trình không thấy được vì vậy anh ta có thể viết chương trình truy cập bất cứ địa chỉ nhớ nào trong toàn bộ không gian địa chỉ lớn đến 1GB. Virtual Disk từ Version 3.0 trở lên, DOS hỗ trợ việc sử dụng bộ nhớ trên 1MB, ta có thể sử dụng nó như 'Virtual Disk' (đĩa ảo hay RAM Disk). Để truy cập vùng nhớ cao này, bộ VXL tạm thời (momentarily) chuyển (switch) sang Protected Mode, thực hiện việc (vận) chuyển dữ liệu rồi lại chuyển trở về Real Mode như bình thường. Kết quả chung là ta có thể sử dụng một bộ nhớ RAM có kích thước lớn, tốc độ thao tác cực nhanh so với tốc độ thao tác trên đĩa. * Protected Mode được người thiết kế OS quan tâm, với người lập trình bình thường chỉ cần quan tâm tới Real Mode là đủ. II Tập lệnh của bộ vi xử lý 8088/8086 1. Bảng lệnh 8088/8086 (xem tài liệu chụp) 2. Phân loại các lệnh Căn cứ vào công việc mà lệnh thực hiện, có thể chia làm 5 nhóm lệnh như sau: 1/ Các lệnh số học: ADD dest,src cộng 2 toán hạng, đặt kết quả trong dest dest:= dest + src ADC dest, src cộng 2 toán hạng, cộng thêm số nhớ (Carry) từ lệnh ADD trước đó dest:= dest + src +Cf INC dest tăng destination lên 1 (dest có thể là thanh ghi hoặc địa chỉ) dest:= dest + 1 DEC dest giảm destination bớt 1 (dest có thể là thanh ghi hoặc địa chỉ) dest:= dest - 1 SUB dest,src lấy dest trừ đi src, để kết quả trong dest dest:= dest - src SBB dest,src lấy dest trừ đi src và trừ thêm số mượn từ lệnh SUB trước đó ,kết quả để trong dest dest:= dest - src - CF NEG dest đổi dấu của toán hạng dest:= 0-dest CMP dest, src so sánh (bằng cách trừ, nhưng không làm thay đổi dest và src) để đặt các cờ hiệu là nhớ, tràn, v.v... MUL src nhân AL hay AX với một số dương (không có dấu) là src (src là reg/mem) AX:= (AL*src8); DX:AX:=(AX*Immed16) IMUL src nhân AL hay AX với một số nguyên có dấu DIV src chia AL hoặc AX cho giá trị trong reg/mem không dấu nếu chia cho 0 hoặc kết quả quá lớn sẽ gây ra INT 0 AL < (AX*src8); AH < (AX MOD src8) AX < (DX:AX*src16); DX < (DX:AX MOD src16) IDIV src chia AL hoặc AX cho giá trị trong reg/mem có dấu CBW đổi byte thành Word AL mở rộng theo dấu vào AH AH được điền đầy theo bit 7 của AL CWD đổi Word thành Word AX mở rộng theo dấu vào DX DX được điền đầy theo bit 15 của AX .v.v... 2/ Các lệnh logic AND dest,src : nhân logic từng bit trong dest và src OR dest,src : OR logic từng bit trong dest và src XOR dest,src : XOR logic từng bit trong dest và src NOT dest : đảo từng bit trong dest (lấy bù 1) .v.v... 3/ Các lệnh vận chuyển số liệu MOV dest,src : copy dữ liệu từ src (reg/mem) tới dest. Lưu ý rằng không thể MOV từ ô nhớ (mem) vào ô nhớ XCHG dest,src đổi (chỗ) giá trị giữa 2 thanh ghi hoặc giữa thanh ghi và bộ nhớ IN Port8 (or DX) nhận dữ liệu từ cổng vào AL hay AX byte : AL port word : AL [port] AH [port+1] OUT Port8 (or DX) gửi dữ liệu từ AL hay AX ra cổng byte : AL port word : AL [port] AH [port+1] LEA reg16, mem1 nạp địa chỉ vào thanh ghi, mem1 phải là một nhãn. reg16 được nạp địa chỉ của mem1 chứ không phải dữ liệu chứa trong mem1 ( nạp kết quả việc tính toán EA của địa chỉ tương đối vào reg16) PUSH src cất giá trị thanh ghi 16 bit (hoặc r/mem16) vào stack PUSH immed cất giá trị 16 bit (hoặc 8 bit mở rộng dấu) vào stack PUSHF cất giá trị của thanh ghi cờ vào stack POP dest chuyển giá trị từ stack vào dest (reg16 hoặc r/mem hoặc thanh ghi đoạn) POPF chuyển giá trị từ stack vào thanh ghi cờ .v.v... 4/ Các lệnh thao tác trên xâu ký tự CLD Clear direction flag to UP (DF:=0) string Ops auto-increment STD set direction flag to Down (DF:=1) string Ops auto-decrement REP/REPE/REPZ lặp lại thao tác xâu ký tự (CX:= CX-1) cho đến khi C=0 REPNE/REPNZ lặp lại thao tác xâu ký tự ,sử dụng kết hợp với lệnh CMPS và SCAS .v.v... 5/ Các lệnh điều khiển sự thực hiên chương trình JMP short/near/far target nhảy không điều kiện đến nhãn short : IP (IP + (target displacement sign-extended)) báo cho assembler là nhãn đích của lệnh nhảy JMP không xa hơn 127 bytes kể từ địa chỉ của lệnh tiếp theo. near : IP (IP + (target displacement) far : SS target_seg; IP target_offset indirect : IP (register or value in memory) JCXZ: nhảy tới nhãn khi CX=0, không kiểm tra cờ LOOP short_label CX CX-1 JA/JNBE JAE/JNB JB/JC JE/JZ JG/JNGE JGE/JNL .V.V... INT TYPE thực hiện ngắt phần mềm (call a systen function) INTO type: if OF=OV=1 then perform INTO type IRET quay trở về từ lệnh gọi ngắt. Nó có ảnh hưởng như lệnh POP IP; POP CS; POPF 6/ Các lệnh điều khiển bộ VXL CLS xoá cờ CY thành NC (CF 0) CMC lấy phần bù (đảo giá trị của) cờ Carry) STC đặt cờ carry thành CY CLD clear direction flag (các lệnh với xâu ký tự tự động tăng) CLI cấm các ngắt (có thể che) STI bỏ mặt nạ ngắt (cho phép có thể ngắt) HLT ngừng xử lý (thực hiện các lệnh NOP cho đến khi một lời gọi ngắt xảy ra) .v.v... 7/ Các lệnh điều khiển tính bảo vệ (80286/80386/80486) (chưa đưa vào chương trình phần này) 3. Phân tích một số mã lệnh - Trong hệ lệnh của 8088/8086... có nhiều lệnh tính chất giống nhau, chỉ khác nhau ở địa chỉ của các toán hạng. Chính vì vậy có những lệnh chỉ cần 1 byte mã lệnh là đủ để bộ VXL thực hiện, lại có những lệnh cần thêm một số thông tin nữa mới có thể thực hiện được, các thông tin này được chứa trong 1 byte, đi ngay sau byte mã lệnh thứ nhất. Việc xác định xem 1 lệnh nào đó có cần đọc thêm byte lệnh thứ 2 hay không được bộ giải mã lệnh quyết định. - Ta phân tích lệnh ADD làm ví dụ: Có các khả năng sau đối với việc cộng 2 toán hạng 1/ r/m r8 : cộng nội dung thanh ghi 8 bit vào một thanh ghi hay 1 ô nhớ 2/ r/m r16 : cộng nội dung một thanh ghi 16 bit và một thanh ghi 16 bit hoặc vào (2) ô nhớ 3/ r8 r/m cộng nội dung từ thanh ghi (8 bit) hoặc từ 1 ô nhớ (tất nhiên là 8 bit) vào 1 thanh ghi 8 bit 4/ r16 r/m cộng nội dung một thanh ghi hoặc ô nhớ vào 1 thanh ghi 16 bit 5/ AL im8 cộng trực tiếp 1 giá trị 8 bit vào AL 6/ AX im16 cộng trực tiếp 1 giá trị 16 bit vào AX 7/ r im8 hoặc im16; trường hợp này r # AX Cấu tạo của mã lệnh như sau: 1/ trường hợp 1 d: direction reg/memory with reg to either = 1: 'to' reg = 0 : 'from' reg 0 0 0 0 0 0 d w mod reg r/m w : word operation = 1 : with word = 0: with byte mã lệnh này chứa đựng các khả năng: nêu ở trên 2/ trường hợp 2 Immediate to reg/mem (not to AX) s: sign s= 1: signed value s= 0: unsigned value 1 0 0 0 0 0 s w mod 0 0 0 r/m data data byte 1 byte 2 nếu s:w = 01 mã lệnh này chứa đựng các khả năng: nêu ở trên 3/ trường hợp 3 Immediate to AX (Accumulator) 0 0 0 0 0 1 0 w data data byte 1 byte 2 nếu s:w = 01 mã lệnh này chứa đựng các khả năng: nêu ở trên III. Cấu tạo của lệnh, các Mode địa chỉ của Assembly Language Trên thị trường có một số Assembler, trong tài liệu này chúng ta sử dụng MACRO ASSEMBLER (MASM); về MASM sẽ được đề cập ở bài 2. 1. Cấu tạo của lệnh nhãn Mã lệnh các toán hạng ghi chú Data: MOV cx,ax ;nạp vào cx giá trị trong ax - Trường nhãn (label field), Nhãn dài tối đa 31 ký tự. ấn định một tên đại diện cho 1 lệnh assembly, để cho các lệnh khác có thể dùng tên này thay cho địa chỉ của lệnh đó trong bộ nhớ. Nhãn không được bắt đầu bằng 1 con số, không chứa dấu phân cách, nhãn kết thúc bằng dấu:; trong nhãn có thể có các ký tự '$', '?', '@','_'... - Mã lệnh (Op-code) dài từ 2-7 ký tự, là những chữ viết tắt gợi trí nhớ, để chỉ các lệnh của bộ vxl. Mã lệnh có thể đứng liền sa dấu ': ' của nhãn hoặc phân cách bởi 1 số dấu cách (space). Giữa mã lệnh và các toán hạng phải có một số dấu cách. - Các toán hạng (operands): báo cho MPU biết phải tìm các toán hạng ở đâu - các ghi chú (comments) dùng để diễn giải dòng lệnh trong chương trình, để đọc lại cho dễ hiểu hơn. Trong các chương trình dài các chú thích rất quan trọng và cần thiết. ghi chú phải đi sau ký hiệu ';' và kết thúc bởi dấu xuống dòng (Enter) 2. Các Mode địa chỉ - Phương pháp xác định vị trí trong bộ nhớ của của 1 toán hạng được gọi là Mode địa chỉ (Addressing Mode). Mode địa chỉ của một toán hạng phụ thuộc vào vị trí trong bộ nhớ của dữ liệu ứng với toán hạng đó. Có một số cách phân loại Mode địa chỉ khác nhau, dưới đây nêu ra hai trong các cách đó: - Cách thứ nhất: chia làm 3 loại Mode địa chỉ: 1. Mode địa chỉ tức thời (Immediate Addressing Mode): sử dụng chính giá trị bằng số ở vị trí của toán hạng. ví dụ mov ax,0001h trong mode địa chỉ này phải có 1 vị trí nhớ hay thanh ghi làm destination.(số chu kỳ máy cần thiết tương ứng là 10 và 4) 2. Mode địa chỉ thanh ghi (register addressing mode) cả dest và src đều là thanh ghi. Vì cả hai đều ở bên trong MPU nên được thực hiện rất nhanh. ví dụ mov ax,cx cần 2 chu kỳ máy 3. Mode địa chỉ bộ nhớ (Memory Addressing Mode) dest hoặc src là địa chỉ nhớ (hay nhãn cũng vậy) có 2 loại mode địa chỉ bộ nhớ: 1. Địa chỉ trực tiếp (direct) 2. Địa chỉ gián tiếp (indirect) -direct: dest hoặc src là một địa chỉ nhớ được xác định bằng số địa chỉ hoặc nhãn. ví dụ: mov ax, mem1 thì nội dung ô nhớ có nhãn mem1 được chuyển vào ax. -indirect: địa chỉ nhớ không được nêu ra trực tiếp. có một thanh ghi dùng để chứa địa chỉ của ô nhớ chứa dữ liệu. Như vậy thanh ghi có tác dụng như là một địa chỉ gián tiếp để xác định vị trí dữ liệu. ví dụ: mov [bx],cx Có một số biến cách của mode gián tiếp này, tuy vậy ý nghĩa cơ bản không khác nhau. - Cách thứ 2: chia làm 7 Mode địa chỉ 1. Register addressing địa chỉ thanh ghi thí dụ MOV AX,BX 2. Immediate addressing địa chỉ tức thời MOV CL,-30; MOV CL, PI (PI EQU 3.14) 3. Direct addressing địa chỉ trực tiếp thí dụ MOV AX,TABLE (trong đó TABLE là một nhãn) 4. Register indirect addressing địa chỉ gián tiếp thanh ghi thí dụ MOV AX,[BX] 5. Base relative addressing địa chỉ tương đối cơ sở thí dụ MOV AX,[BX] + 4 6. Direct indexed addressing địa chỉ được chỉ số hoá trực tiếp (MOV DI,2) MOV AL, TABLE[DI] (trong đó TABLE là một tên của 1 byte (tên biến) 7. Base indexed addressing địa chỉ được chỉ số hoá cơ sở MOV AX, [BX][DI+2] IV. Các chỉ thị cho Assembler (Assembler Directives) (có khoảng 60) Các chỉ thị Assembler trông rất giống các mã lệnh ngôn ngữ Assembly, mỗi chỉ thị gồm có 4 trường (Fields) tên Chỉ thị đối số (argument) ghi chú PI EQU 3.14 ;xác định giá trị của PI - tên (name field) cũng giống như trường nhãn trong dòng lệnh có chỉ thị assembler cần trường tên, có chỉ thị không cần, tên bắt đầu bằng chữ cái, kết thúc bằng khoảng trống. - Chỉ dẫn Assembler (directive field) cũng tương tự như Op_code trong dòng lệnh. bắt đầu bằng khoảng trống và kết thúc bằng khoảng trống hoặc xuống dòng - argument field: chứa 1 địa chỉ nhớ hoặc 1 số để sử dụng cùng với chỉ thị và do chỉ thị xác định. bắt đầu bằng khoảng trống và kết thúc bằng xuống dòng *trong các chương trình đơn giản thường dùng các chỉ thị sau: ASSUME chỉ định các thanh ghi đoạn; giúp Assembler đổi các nhãn thành các địa chỉ bằng cách báo cho Assembler biết ta định dùng thanh ghi đoạn nào để đánh địa chỉ các nhãn này. format: ASSUME Seg-reg: Seg-name [,...] trong đó Seg-reg là một trong các thanh ghi đoạn sau DS, CS, ES, SS; Seg-name là tên sẽ đứng trước chỉ thị SEGMENT. thí dụ assume cs: cseg, ds: dseg SEGMENT Định nghĩa đoạn Dạng chung: SEGMENT COMBINE-TYPE ALIGN_TYPE CLASS .. ALIGN_TYPE: chỉ ra biên của segment bắt đầu ở đâu trong bộ nhớ. - BYTE: begin anywhere. - WORD: begin at an even-numbered address (word). - PARA: begin at an address divisible by 16 - PAGE: begin at an address divisible by 256 COMBINE_TYPE: chỉ ra một Segment sẽ được kết hợp với các Segment khác có cùng tên như thế nào. Một chương trình có thể sử dụng 4 Segment: Data, Code, Extra và Stack. Code, Data và Extra có thể được nối lại (joined) với nhau (PUBLIC) hoặc trùm lên nhau (Overlapped) (COMMON). Stack Segment nhất thiết phải có kiểu STACK. CLASS TYPE: ảnh hưởng tới thứ tự sắp đặt các Segment trong bộ nhớ. Các Segment có cùng tên Class được sắp đặt liên tiếp, Các Segment khác tên Class được sắp đặt theo thứ tự mà chương trình LINK gặp. - CODE - DATA - EXTRA Với SEGMENT directive ta có thể dùng như sau: với DATA SEGMENT: SEGMENT PARA PUBLIC 'DATA' với CODE SEGMENT: SEGMENT PARA PUBLIC 'CODE' với EXTRA SEGMENT: SEGMENT PARA PUBLIC 'EXTRA' với STACK SEGMENT: SEGMENT PARA STACK 'STACK' ENDS nơi kết thúc đoạn hay cấu trúc. SEGMENT và ENDS chỉ đánh dấu điểm đầu và điểm cuối của một Segment, chúng không cho Assembler biết đang định nghĩa loại Segment gì; việc này là nhiệm vụ của Pseudo-Op: ASSUME. ORG địa chỉ khởi đầu của chương trình DB định vùng dữ liệu dạng byte DW định vùng dữ liệu dạng word DD định vùng dữ liệu dạng 2 word, thí dụ DD 0 nghĩa là 4 byte bằng 0 DUP lặp lại dữ liệu EQU Equate: gán tên cho một hằng số (kiểu số hoặc kiểu String) tên này vĩnh viễn nhận giá trị hằng số đó (khác với Directive = ') thí dụ PI EQU 3.14 Message EQU 'Hay vao so lieu' PUBLIC khai báo tên dùng chung, làm cho 1 hoặc nhiều symbol đã được ĐN có thể được dùng chung trong nhiều Module mà các Module đó sẽ được Linked với Module chứa khai báo PUBLIC này. Dạng: PUBLIC Symbol [,...] Symbol ở đây có thể là các tên biến, nhãn kể cả các nhãn của Proc và các tên đã được định nghĩa bởi các Pseudo_Op EQU, = . PUBLIC có bạn đồng hành là EXTRN EXTRN External - Báo là tham chiếu ngoài; format: External name: type[,...] Như EXTRN get_hex chỉ ra các SYMBOL đã được định nghĩa trong Modul get_hex - NAME là một Symbol đã được định nghĩa và được mô tả là PUBLIC ở một Modul hợp ngữ khác. - TYPE có thể là một trong các kiểu sau: + nếu NAME là một ký hiệu trong DATA SEGMENT, EXTRA SEGMENT thì kiểu có thể là BYTE, WORD hoặc DWORD + nếu NAME là một nhãn thủ tục thì kiểu có thể là NEAR hoặc FAR + nếu NAME là một hằng được định nghĩa bởi EQU, =, thì kiểu phải là ABS * chú ý: PUBLIC và EXTRN thường được sử dụng để phân chia các thủ tục. Chẳng hạn để chạy một thủ tục có tên là SORT từ chương trình chính thì MODUL trong đó định nghĩa SORT phải chứa khai báo PUBLIC SORT và MODUL chính có chứa lời gọi tới SORT phải có chứa khai báo: EXTRN SORT: NEAR (hoặc FAR). PROC và ENDP đánh dấu chỗ bắt đầu và chỗ kết thúc thủ tục. Thủ tục là một khối các chỉ thị (instructions) có thể được gọi thực hiện từ các vị trí khác nhau trong chương trình. END nơi kết thúc chương trình nguồn Dạng: END Nhãn điểm vào chương trình (nhãn của lệnh đầu tiên của chương trình) Nếu chương trình của ta có chứa nhiều MODUL, ta (phải) gán nhãn cho chỉ dẫn END ở cuối MODUL chương trình chính, còn trong các MODUL phụ khác nhau không được gán nhãn cho chỉ dẫn END *sau đây là bảng các chỉ thị cho assembler AND và logic, ví dụ: mov ax,7 and 8 BYTE định dữ liệu dài 1 byte COMMENT bắt đầu của lời bình CREF cross reference:danh sách các ký hiệu dùng để tham chiếu chéo CGROUP (TLTK, bản dịch của LNH, trg 44) DGROUP (TLTK, bản dịch của LNH, trg 44) DQ define quadruple:định vùng dữ liệu dạng 4 word như DQ 0:tám byte 0 DT define ten: định vùng dữ liệu dạng 10 byte như DT 0: mười byte 0 DW define word: định vùng dữ liệu dạng word (2 byte) DWORD double word: định dữ liệu dài 2 word như: JMP DWORD PTR[SI] DUP Duplicate: lặp lại một xâu . Như 10 DUP ('stack') ELSE ENDIF ENDM end macro ENDP EQ Equal: so sánh logic EVEN Đặt địa chỉ chẵn EXITM Exit macro. Thoát khỏi macro FAR Báo nhãn nằm ở ngoài đoạn. Như old_e LABEL FAR GE Greater than or Equal. Phép toán logic lớn hơn hay bằng GROUP Nhóm các đoạn thành một đoạn; Như Nhóm GROUP code, data (TLTK, bản dịch của LNH, trg 44) GT Greater Than. Phép toán logic lớn hơn HIGH Chỉ byte cao của một word ;* Về các Pseudo_Op điều kiện, xem (TLTK, bản dịch của LNH, trg 45) IF Khối điều kiện IF1 Khối điều kiện cho lần duyệt thứ nhất IF2 Khối điều kiện cho lần duyệt thứ hai IFB If blank. Khối điều kiện khi không có tham số IFDEF If Defined. Khối điều kiện khi đã có định nghĩa IFDIF If diffent. Khối điều kiện khi hai tham số khác nhau IFE If Equal. Khối điều kiện khi bằng 0 IFIDN If Identical. Khối điều kiện khi hai tham số bằng nhau IFNB If not Blank. Khối điều kiện khi có tham số INCLUDE Chèn thêm vào chương trình một số chỉ thị lấy từ một tập tin khác. Như INCLUDE mylib.mac IRP Indefinite Repeat. Macro có số lần lặp không xác định. Như IRP para?. sẽ lặp lại 4 lần IRPC Indefinite Repeat Character. Macro có số lần lặp chữ không xác định. Như IRPC para?. ABCD sẽ lặp lại 4 lần LABEL Nhãn (TLTK, bản dịch của LNH, trg 44) LE Less than or Equal. Phép toán logic nhỏ hơn hay bằng LENGTH Xác định chiều dài một kí hiệu LOCAL Định các kí hiệu chỉ được dùng trong nội bộ macro LOW Chỉ byte thấp của một word LT Less Than. Phép toán logic nhỏ hơn .LALL Liệt kê toàn bộ macro .LFCOND Liệt kê khối điều kiện .LIST Liệt kê chương trình MACRO Bắt đầu macro MASK Mặt nạ dạng bit MOD Modulo. Cho số dư trong phép chia NAME Định tên của một chương trình hay mô-đun NE Not Equal. Phép toán logic không bằng NEAR Báo nhãn nằm trong đoạn NOT Phép toán logic lấy bù OFFSET Offset trong đoạn OR Phép toán logic hoặc %OUT In xâu ra màn hình PAGE Bắt đầu trang mới và định kích thước trang sẽ được in ra (màn hình và máy in) khi hợp dịch. Dạng: PAGE [LINE], [COLLUMN] ngầm định là: 57,80 (hợp với khổ giấy A4) PTR Pointer. Dùng chung với BYTE, WORD, DWORD, NEAR và FAR để định kích thước của một nhãn hay một biến .RADIX Định cơ số RECORD Định kiểu bản ghi REPT Repeat. Macro lặp .SALL Không liệt kê macro SEG Giá trị đoạn ứng với một kí hiệu SHL Shift left. Phép dịch chuyển trái.Như MOV AX,7 SHL 1 SHORT Nhảy xuôi gần SHR Shift right. Phép dịch chuyển phải. Như MOV A,8 SHR 1 .SFCOND Không liệt kê các khối điều khiển sai STRUC Structure. Định nghĩa cấu trúc .TCOND Liệt kê mặc định cho các khối điều kiện TITLE Psuedo_Op để tạo ra một tiêu để được căn thẳng trái trên dòng thứ 2 của mỗi trang (in). TITLE thường được đặt ở đầu chương trình, nhưng ta cũng có thể đặt nó ở bất cứ đâu trong chương trình. Độ dài tối đa của TITLE: 60 dòng SUBTTL Sub Title để tạo ra một tiêu đề phụ được định tâm ở dòng thứ 3 (của trang tiếp theo ?), tiêu đề này thường được sử dụng để mô tả nội dung của trang đó Độ dài tối đa của SUBTITLE: 60 dòng XOR Phép toán logic hoặc. Như MOV AX,7 XOR 9 .XALL Liệt kê các macro sinh ra các mã lệnh hoặc dữ liệu .XCREF Không liệt kê danh sách để tham chiếu chéo .XLIST Không liệt kê chương trình WIDTH Định độ rộng của trường trong bản ghi WORD Định dữ liệu dài một word = Gán tên cho một hằng (kiểu số hoặc kiểu String) sau này trong chương trình có thể gán lại (khác với Directive EQU) .286C giả lệnh chế độ, báo cho Assembler sử dụng tập lệnh của 80286 phải đặt nó tại đầu chương trình, ngay sau các Pseudo-Op liệt kê danh sách. .8086 giả lệnh chế độ, báo cho Assembler sử dụng tập lệnh của 8086 đây là chế độ ngầm định. $ Offset hiện hành V. các toán tử trong Assembly language ( Phần này sử dụng để tra cứu, TLTK số 1, trang 48 ) Toán tử là một sự sửa đổi (modifier) được sử dụng trong trường toán hạng (Operand Field) của một Op_code hay Pseudo_Op. Có 5 loại toán tử: Số học, logic, quan hệ, trả lại giá trị, cho thuộc tính. (An operator is a modifier used in the operand field of an assembly language or pseudo-op statement.) 1. Toán tử số học (xem trang 29) * format: value1 * value2;multiplies value2 by value1 * format: value1 * value2;multiplies value2 by value1 / format: value1 / value2;divides value1 by value2 and returns the the quotient. MOD format: value1 MOD value2; divides value1 by value2 and returns the remainder. SHL format: value SHL expression; shifts values left by expression bit positions. SHR format: value SHR expression; shifts values right by expression bit positions. 2. Toán tử logic (xem trang 29) AND format: value1 AND value2; takes logical AND of value1 and value2 OR format: value1 OR value2; takes logical inclusive-OR of value1 and value2 XOR format: value1 XOR value2; takes logical exclusive-OR of value1 and value2 NOT format: NOT value; reverses the state of each bit in value; that is, it takes the one's complement. 3. Toán tử quan hệ (xem trang 30) EQ format operand1 EQ operand2; true if the two operands are identical. NE format operand1 NE operand2; true if the two operands are not identical. LT format operand1 LT operand2; true if operand1 is less than operand2. GT format operand1 GT operand2; true if operand1 is greater than operand2. LE format operand1 LE operand2; true if operand1 is less than or equal to operand2. GE format operand1 GE operand2; true if operand1 is greater than or equal to operand2. 4. Toán tử trả lại giá trị (xem trang 30) $ format: $ cho lại giá trị hiện thời của bộ đếm vị trí bộ nhớ. SEG format: SEG Var_name, hoặc SEG Label_name trả lại giá trị Segment của biến hoặc nhãn OFFSET format: OFFSET Var_name. hoặc OFFSET Label_name trả lại giá trị OFFSET của biến hoặc nhãn LENGTH format: LENGTH Var_name trả lại độ dài tính bằng đơn vị (Byte hoặc Word) của biến đã được định nghĩa bằng DUP. TYPE format: TYPE Var_name, hoặc TYPE Label_name đối với các biến, TYPE cho lại 1 nếu là kiểu Byte, 2 nếu là kiểu Word, 4 nếu là kiểu Double Word. đối với các nhãn TYPE cho lại -1 nếu là NEAR, -2 nếu là FAR. SIZE Dạng SIZE Var_name trả lại giá trị là tích của Length và Type 5. Toán tử thuộc tính PTR format: TYPE PTR EXPRESSION khai báo lại kiểu (type) (BYTE hoặc WORD) hoặc khoảng cách (NEAR hoặc FAR) của một toán hạng địa chỉ bộ nhớ. TYPE là thuộc tính mới còn Expression là một tên (indentifier) mà thuộc tính của nó bị thay đổi (overriden). DS: format: seg-reg:addr-expr hoặc ES: seg-reg:label hoặc SS: seg-reg:variable CS: thay thế (overrides) thuộc tính đoạn (segment attribute) của một nhãn, biến hoặc biểu thức địa chỉ. SHORT xem ở lệnh JMP, trang HIGH format: HIGH value hoặc HIGH expression trả lại giá trị là byte cao của 1 giá trị số hoặc địa chỉ 16 bit LOW format: LOW value hoặc LOW expression trả lại giá trị là byte thấp của 1 giá trị số hoặc địa chỉ 16 bit. VI Hằng số trong chương trình nguồn Assembler chấp nhận việc sử dụng một vài dạng hằng số sau: 1. Binary là một dãy số 0,1 kết thúc bởi ký tự B, thí dụ 10111010B 2. Decimal là một dãy các chữ số từ 0 đến 9, có thể kết thúc bởi ký tự D hoặc không cũng được, thí dụ 512 , 512D 3. Hexadecimal là một dãy các chữ số từ 0 đến 9 và các ký tự A, B, C, D, E, F - phải kết thúc bởi ký tự H - ký tự đầu tiên nhất thiết phải là chữ số (0..9) thí dụ 8FH, 0EDH 4. Character đó là một dãy các chữ cái, chữ số, ký hiệu được ghi trong dấu nháy đơn hay kép, thí dụ 'Hello World!', "Don't enter a number here" bài tập 1. Đổi các số thập phân sau sang dạng nhị phân: a) 12; b) 17; c) 45; d) 72 2. Đổi các số nhị phân sau sang dạng thập phân: a) 00001000; b) 00010101; c) 00011111; d) 11000011 3. Đổi các số ở câu 2 sang dạng thập lục phân 4. Đổi sang dạng thập phân số 0D8H trong trường hợp: - 0D8H biểu diễn số không dấu - 0D8H biểu diễn số có dấu ---------- hết bài 1 ---------- Bài giảng môn Assembly Language, Bài 1 - $ - Nguyễn Đình Việt, Khoa CNTT, ĐHQGVN,HN 1995 --------------------------------------------------------------------------- Bài 2 Các bước trong quá trình tạo 1 chương trình chạy được Trên thị trường có khá nhiều Assembler, trong các bài giảng môn học này chúng ta sẽ sử dụng Macro Assembler của MicroSoft (MASM.EXE), nó tương thích với IBM Macro Assembler. Cho đến nay (1990), IBM đã đưa ra thị trường 2 Version của Macro Assembler, Version 1 , version2. Để xây dựng chương trình cho họ máy AT, chúng ta cần phải dùng version 2 (của IBM Macro Assembler) hoặc version 3 (của MicroSoft Macro Assembler). Đĩa Macro Assembler của IBM có 2 chương trình Assembler tách biệt: - Small Assembler (ASM): để dùng cho các máy tính có bộ nhớ <= 128 KB và có tập lệnh ít hơn của MASM. MicroSoft không có Small Assembler như IBM. - Macro Assembler (MASM) I. Các bước chính Bứơc 0: Xác định nhiệm vụ của chương trình, thiết kế chương trình. Trong bước này ta thường cần vẽ lưu đồ (Flowchart). Bước này đặc biệt quan trọng nếu chương trình là dài và phức tạp. Nên thực hiện chiến thuật "Top-Down Program Design". Bước 1. Soạn chương trình nguồn Dùng 1 chương trình soạn thảo văn bản, ví dụ SideKick, Turbo Pascal để soạn thảo chương trình nguồn - Không nên dùng các hệ soạn thảo trong đó có sử dụng các mã ASCII mở rộng, hoặc các ký tự điều khiển (Như Word Perfect, Bked .v.v...) - dùng SideKick có rất nhiều tiện lợi, vì đó là chương trình thường trú nhỏ các lệnh soạn thảo khá giống Turbo Pascal Version 3.01a, quen thuộc với sinh viên. - dùng Turbo Pascal để soạn thảo rất dễ trình bày chương trình nguồn đẹp vì chức năng TAB của nó rất tiện lợi cho soạn thảo chương trình. - (hướng dẫn sinh viên sử dụng SideKick nếu cần thiết) - ghi file nguồn lên đĩa, ví dụ với tên là vidu1.asm Bước 2. Hợp dịch chương trình nguồn - Hợp dịch A:\> masm vidu1 sau đó ta phải trả lời 3 câu hỏi sau: Object filename [vidu1.obj]: nếu ta đồng ý thì ấn Enter (nói chung là ta đồng ý với các gợi ý của MASM) Source Listing [Nul.lst]: Cross Reference [Nul.crf]: Sau đó MASM sẽ hiển thị như sau: Microsoft (R) Macro Assembler Version 5.10 Copyright (C) Microsoft Corp. 1981-1985. All right reserved. 51712 + 154624 Bytes symbol space free nn nnn Byte Free m Warning Errors l Severe Errors A:\> trường hợp không có lỗi nào xảy ra thì m=0, l=0 - Về File .lst Đây là File văn bản nguồn do MASM tạo ra, nó chứa các lệnh nguồn và các mã số của chúng để ta có thể in ra xem cách Assembler biên dịch chương trình của mình. Trong file .lst Macro Assembler còn đưa ra cả địa chỉ (Segment:Offset) của các lệnh và dữ liệu của chương trình, việc này rất có ích khi chúng ta muốn phân tích các chương trình khó, chẳng hạn phân tích các đoạn mã Virus .v.v. - cross-reference listing file: File vidu1.crf (crf: cross reference) còn gọi là File tham khảo chéo, (cross-reference listing), nó cho số dòng tại đó mỗi ký hiệu (symbol) được định nghĩa và số hiệu tất cả các dòng khác, tại đó có tham chiếu (refer to) tới ký hiệu này. Để MASM.EXE sinh ra file này khi được hỏi: Cross Reference [Nul.crf]: ta cần đánh tên file (đuôi ngầm định là .crf). Sau khi đã hợp dịch (chạy MASM.EXE) cần chạy chương trình CREF.EXE CREF VIDU1; - .MAP - Map listing file (file bản đồ chương trình) Việc tạo ra file này là tuỳ chọn đối với LINK.EXE. File này tóm tắt về các đoạn của chương trình, trong mỗi đoạn nó chỉ ra địa chỉ offset 'start' và 'stop' , chiều dài mỗi đoạn của chương trình và class (loại) của các đoạn. Để tạo ra file .MAP ta làm như sau: LINK VIDU1,,; (2 dấu phẩy trước dấu chấm phẩy) Lưu ý: - trường hợp có đánh dấu '; ' sau tên của chương trình nguồn: MASM.EXE tự động đặt tên file đích là vidu1.obj , không tạo các file .lst và .crf tương ứng. - trường hợp không đánh dấu '; ' sau tên của chương trình nguồn: MASM.EXE thực hiện theo các bước nêu trên. - cách sử dụng các chỉ dẫn cho MASM.EXE để có thể in các thông báo lỗi ra máy in, tạo các file tham chiếu chéo, định trang in (số dòng/1 trang, số cột mỗi dòng) ... * sau bước này Assembler mới tạo ra File vidu1.obj; đây là một File trung gian, gọi là File đích (Object file), nó chứa chương trình của chúng ta ở dạng ngôn ngữ máy, nhưng kèm theo một số thông tin mà chương trình Link của DOS sẽ dùng đến. - sửa các lỗi do Assembler thông báo: nếu có lỗi, Assembler sẽ thông báo số thứ tự của dòng có lỗi, loại lỗi, sau đó Assembler tiếp tục hợp dịch các dòng chương trình nguồn tiếp sau và lại thông báo lỗi nếu gặp phải. Ta nên ghi lại các thông báo lỗi và STT dòng có lỗi để sửa (có thể in luôn ra giấy bằng lệnh Print Screen) luôn một lần. - hợp dịch lại và lại sửa lỗi cho đến khi hết lỗi * Một số thông báo lỗi của Macro Assembler: - Block nesting error: thông báo lỗi này thường kèm theo thông báo "Open procedures" hoặc "Open segments", hãy xem giải thích về các thông báo này như ở dưới đây. - End of file, no END directive: thiếu chỉ thị assembler END ở cuối file hoặc phải thêm 1 dòng trống sau dòng chứa chỉ thị END. - Must be declared in pass 1: thông báo này thường liên quan đến giả lệnh GROUP, có thể ta chưa định nghĩa một tên đoạn được khai báo trong giả lệnh GROUP. - No or Unreadable CS: MASM cần thấy giả lệnh ASSUME khi hợp dịch một số chỉ thị như CALL hay JMP. - Open procedures: thiếu nhãn PROC hay ENDP hoặc các tên không trùng nhau trong cặp giả lệnh PROC - ENDP. - Open segments: thiếu giả lệnh Segment hoặc ENDS hoặc tên đi cùng với hai giả lệnh này. - Symbol not defined Đây là một thông báo lỗi thường thấy khi chúng ta mới học ngôn ngữ Assmblly, cần kiểm tra các vấn đề sau: + sử dụng một tên chưa khai báo hoặc đánh sai một tên đã được khai báo + thiếu khai báo EXTRN mà chương trình lại sử dụng một tên nằm trong Modul ngoài; hoặc tên trong modul ngoài và tên được gọi đến không trùng nhau (do ta đánh sai chẳng hạn) Bước 3 Link (kết nối chương trình và số liệu .v.v...) chương trình LINK có 2 nhiệm vụ chính: 1./ DOS có thể để 1 chương trình ở chỗ nào đó do nó sắp đặt cho thuận tiện. Việc này tránh cho NSD không phải chỉ ra việc đặt chương trình ở đâu. Muốn cho chương trình nguồn (và sau đó là dạng .obj) sử dụng được đặc điểm này (relocatable) cần phải có chương trình LINK của DOS. 2./ NSD thường viết chương trình theo các modul, thử riêng rẽ từng Modul, do vậy sẽ tạo ra nhiều file .obj tương ứng. Nhiệm vụ thứ 2 của LINK chính là kết nối các object module lại thành 1 modul duy nhất, chạy được. Thí dụ LINK MOD1 + MOD2 + MOD3 sẽ kết nối các file MOD1.OBJ, MOD2.OBJ, MOD3.OBJ để tạo thành file MOD1.EXE chạy được. Ta cần sử dụng chương trình Link.exe (lệnh ngoại trú của DOS) để tạo ra một file .exe từ File .obj. - A:\> Link vidu1; Microsoft 8086 Object Linker Version 3.02 (C) Copyright Microsoft Corp. 1983, 1984, 1985 Warning: No stack segment There was an error detected Error là lỗi nhưng chính là điều chúng ta muốn, nó báo rằng chưa có đoạn stack. * sau khi thực hiện bước này, ta có file vidu1.exe, nói chung có thể cho chạy ngay được. Tuy nhiên ta cần nghiên cứu cách tạo file .com trước đã. * Xem tuỳ chọn của LINK để tạo ra file .MAP đã trình bày ở bước 2. * Một số thông báo lỗi của LINK - Fixup offset exceeds field with: Với thông báo này ta cũng khó tìm ra được lỗi, có thể là do có một lời gọi xa tới một thủ tục (Call far) nhưng trong thủ tục đó lại khai báo nó là near (Proc near). Lỗi này cũng có thể xảy ra nếu toàn bộ chương trình vượt quá 64KB, dùng file .MAP có thể thấy được điều này. - Symbol defined more than once: xảy ra khi LINK phát hiện thấy 1 biến hay thủ tục được định nghĩa trong hai file. - Unresolved externals: có thể do thiếu khai báo public cho 1 biến hay thủ tục, hoặc tên trong 1 thủ tục external sai. - Warning: no stack segment Đây thực ra không phải là thông báo lỗi mà là lời nhắc nhở của LINK, ta thường luôn thấy nó khi LINK các file .OBJ để tạo ra các file .COM Bước 4. Dịch chương trình sang File dạng .COM Để tạo ra file .com, ta cần chương trình Exe2bin.exe của DOS. Chương trình này chuyển 1 file dạng .exe hay .bin sang file dạng .com - Exe2bin vidu1 vidu1.com Chúng ta dùng lệnh DIR của DOS để kiểm tra sự tồn tại của vidu1.com trên đĩa. Đôi khi có thể thấy thông báo lỗi 'File cannot be converted', đây là thông báo lỗi duy nhất của EXE2BIN, nguyên nhân sinh ra lỗi này có thể như sau: + các đoạn xếp sai thứ tự, cần kiểm tra lại bằng file .MAP (xem phụ lục C trong sách 'Nhập môn Assembler', Peter Norton. + chương trình chính không đứng đầu tiên trong lệnh LINK. + chương trình chính không có chỉ thị Assembler ORG 100H đứng liền dưới khai báo CODE_SEG SEGMENT PUBLIC. Ngoài ra cần kiểm tra lại xem sau chỉ thị END cuối cùng trong modul chương trình chính đã ghi nhãn của lệnh đầu tiên của chương trình chưa. - Lưu ý: các Version Dos sau 5.0 không có File Exe2bin.exe vì DOS không chủ trương hỗ trợ việc tạo các file .com, muốn thực hiện bước 4 này ta cần đặt lệnh DEVICE=PATH_NAME\SETVER.EXE trong file CONFIG.SYS, tất nhiên cần phải có SETVER.EXE tại đường dẫn PATH_NAME. Bước 5. Chạy thử chương trình - Nếu chương trình không dài, thì tốt nhất là dùng Debug để chạy thử từng bước Lệnh T (Trace), theo dõi quá trình biến đổi nội dung các thanh ghi, việc chuyển số liệu .v.v... - Nếu chia chương trình thành từng khối, có thể hợp dịch từng khối và cho chạy thử từng Modul, sau khi chạy tốt mới ghép nối lại với nhau. - Nếu có lỗi thì lặp lại các bước trên II. Hướng dẫn sử dụng chương trình Debug Trình bày 19 lệnh của DEBUG, 4 lệnh còn lại liên quan đến bộ nhớ mở rộng XMS và EMS không cần trình bày. Bài tập 2.1 In ra màn hình 1 ký tự (ký tự 'A') Bài tập 2.2 In ra màn hình một xâu ký tự 'Darling, I love you' Bài tập 2.3 hỏi tên người (từ bàn phím) rồi gửi lời chào người đó Bài tập 2.4 Nhận vào từ bàn phím 5 xâu ký tự (n <= 5); in ra màn hình 1 trong 5 xâu ký tự đó Bài tập 2_1 (BT2_1.ASM) In ra màn hình 1 ký tự (ký tự 'A') Seg_a segment:100 jmp 103 assume cs:seg_a, ds:seg_a:102 db 41 org 100h:103 mov ah,02 start: jmp short loc_1:105 mov dl,[102] data_1 db 41h:109 int 21 loc_1 mov ah,02:10b int 20 mov dl,data_1 int 21h int 20h seg_a ends end start ;-------------------------------------------------------------------------- Bài tập 2.2 In ra màn hình một xâu ký tự 'Darling, I love you' Seg_a segment:100 jmp 118 assume cs:seg_a, ds:seg_a:102 db'Darling, I love you$' org 100h:118 mov dx,0102 start: jmp short loc_1:11b mov ah,09 data_1 db'Darling, I love you$':11d int 21 loc_1 mov dx,offset data_1:11f int 20 mov ah,09 int 21 int 20 seg_a ends end start ;-------------------------------------------------------------------------- Bài tập 2.3 hỏi tên người (từ bàn phím) rồi gửi lời chào người đó ;========================================================================== ;== BT2_3.LST == ;== Created: 4-Aug-95 == ;== Passes: 5 Analysis Options on: QRSUX == ;========================================================================== SEG_A SEGMENT BYTE PUBLIC ASSUME CS:SEG_A, DS:SEG_A ORG 100h BT2_3 PROC FAR 94E0:0100 START: 94E0:0100 EB 25 JMP SHORT LOC_1;(0127) 94E0:0102 90 DB 90H 94E0:0103 0D 0A 24 DATA_1 DB 0DH, 0AH, '$' 94E0:0106 57 68 61 74 20 69 DATA_2 DB 'What is your name ?: $' 94E0:010C 73 20 79 6F 75 72;xref 94E0:0129, 012C 94E0:0112 20 6E 61 6D 65 20 94E0:0118 3F 20 3A 20 24 94E0:011D 48 65 6C 6C 6F 20 DATA_3 DB 'Hello Mr.$';xref 94E0:0143, 0146 94E0:0123 4D 72 2E 24 94E0:0127 LOC_1:;xref 94E0:0100 94E0:0127 B4 09 MOV AH,9 94E0:0129 .BA 0106 MOV DX,OFFSET DATA_2 94E0:012C CD 21 INT 21H;DOS Service 09h ;display char string at ds:dx 94E0:012E B4 0A MOV AH,0AH 94E0:0130 .BA 015F MOV DX,OFFSET DATA_4 94E0:0133 8B DA MOV BX,DX 94E0:0135 C6 07 FE MOV BYTE PTR [BX],0FEH 94E0:0138 CD 21 INT 21H; DOS Service 0Ah ; get keybd line, put at ds:dx 94E0:013A B4 09 MOV AH,9 94E0:013C .BA 0103 MOV DX,OFFSET DATA_1 94E0:013F CD 21 INT 21H 94E0:0141 B4 09 MOV AH,9 94E0:0143 .BA 011D MOV DX,OFFSET DATA_3 94E0:0146 CD 21 INT 21H 94E0:0148 B4 09 MOV AH,9 94E0:014A .BB 015F MOV BX,OFFSET DATA_4 94E0:014D 8B D3 MOV DX,BX 94E0:014F 02 5F 01 ADD BL,[BX+1] 94E0:0152 83 C3 02 ADD BX,2 94E0:0155 C6 07 24 MOV BYTE PTR [BX],24H; '$' 94E0:0158 83 C2 02 ADD DX,2 94E0:015B CD 21 INT 21H 94E0:015D CD 20 INT 20H; Program Terminate 94E0:015F 3F DATA_4 DB 3FH; '?' BT2_3 ENDP SEG_A ENDS END START ;-------------------------------------------------------------------------- Bài tập 2.4 Nhận vào từ bàn phím 5 xâu ký tự (n <= 5); in ra màn hình 1 trong 5 xâu ký tự đó ;GET 5 STRING FROM KBD, THEN ASK WHICH OF THEM WILL BE SEND TO SCR CGROUP GROUP CODE_SEG ASSUME CS: CGROUP CODE_SEG SEGMENT BYTE PUBLIC ORG 100H START: JMP FIRST MSG DB "Enter 5 string ",0DH,0AH,"$" MSG1 DB "one:$" MSG2 DB "two:$" MSG3 DB "three:$" MSG4 DB "four:$" MSG5 DB "five:$" ASK_FOR_OUT DB "Which string will be out ?: $" NUMBER DB 0 FIRST: MOV AH, 09H MOV DX,OFFSET MSG INT 21H MOV AH,09H;ask for 1st string MOV DX,OFFSET MSG1 INT 21H MOV AH,0AH MOV DX,OFFSET STR1 INT 21H CALL CR_LF MOV AH,09H;ask for 2nd string MOV DX,OFFSET MSG2 INT 21H MOV AH,0AH MOV DX,OFFSET STR2 INT 21H CALL CR_LF MOV AH,09H;ask for 3rd string MOV DX,OFFSET MSG3 INT 21H MOV AH,0AH MOV DX,OFFSET STR3 INT 21H CALL CR_LF MOV AH,09H;ask for 4th string MOV DX,OFFSET MSG4 INT 21H MOV AH,0AH MOV DX,OFFSET STR4 INT 21H CALL CR_LF MOV AH,09H;ask for 5th string MOV DX,OFFSET MSG5 INT 21H MOV AH,0AH MOV DX,OFFSET STR5 INT 21H CALL CR_LF MOV AH,09H MOV DX,OFFSET ASK_FOR_OUT INT 21H MOV AH,01;GET STRING NUMBER TO SEND OUT INT 21H CALL CR_LF SUB AL,30H MOV NUMBER,AL MOV AX,100H;256d XOR CX,CX MOV CL,NUMBER DEC CL MUL CX ADD AX,OFFSET STR1 MOV BX,AX MOV CL,[BX+1] ADD BX,CX ADD BX,2 MOV BYTE PTR [BX],"$" MOV DX,AX ADD DX,2 MOV AH,09H INT 21H INT 20H ;-------------------------------------------------------------------------- CR_LF PROC NEAR PUSH AX PUSH DX MOV AH,02 MOV DL,13 INT 21H MOV DL,10 INT 21H POP DX POP AX RET CR_LF ENDP ;-------------------------------------------------------------------------- STR1 DB 0FEH,?,0FEH DUP(0) STR2 DB 0FEH,?,0FEH DUP(0) STR3 DB 0FEH,?,0FEH DUP(0) STR4 DB 0FEH,?,0FEH DUP(0) STR5 DB 0FEH,?,0FEH DUP(0) CODE_SEG ENDS END START Bài giảng môn Assembly Language, Bài 2 - $ - Nguyễn Đình Việt, Khoa CNTT, ĐHQGVN,HN 1995 --------------------------------------------------------------------------- Bài 3 Dạng của 1 chương trình mẫu Bài này trình bày -các mô hình tổng quát để xây dựng nên 1 chương trình. Mẫu chương trình này là chung nhất cho mọi chương trình. Khi chúng ta viết chương trình của mình, ta chỉ cần điền số liệu và các chỉ thị cho chương trình cụ thể đó. -về sự khác nhau giữa .com files và .exe files I. Main Program Module: Mô dul chương trình chính Sau đâu là 1 mẫu chung cho 1 modul nguồn, nó bao gồm 1 chương trình đầy đủ hoặc nó sẽ được kết nối với 1 hoặc 1 số modul (phụ) khác để tạo nên 1 chương trình. PAGE ,132 TITLE (Insert title here) SUBTTL (Insert sub_title here) (Insert EXTRN statement, if approriate) STACK SEGMENT PARA PUBLIC 'STACK' DB 64 DUP('STACK ') STACK ENDS DSEG SEGMENT PARA PUBLIC 'DATA' (Insert data here) DSEG ENDS CSEG SEGMENT PARA PUBLIC 'CODE' ASSUME CS:CSEG, DS:DSEG, SS:STACK ENTRY PROC FAR;entry point ;set up the stack to contain the proper values so this program ;can return to DOS or Debug PUSH DS SUB AX,AX PUSH AX ;initialize the data segment address MOV AX,DSEG MOV DS,AX (insert instructions here) RET;return to DOS or Debug ENTRY ENDP CSEG ENDS END ENTRY chú ý mẫu này là chương trình tổng quát, ta có thể sửa đổi 1 số điểm sau: -Title: Tiêu đề thường chỉ ra tên File trên đĩa của chương trình này -Nếu Modul này có chứa tham chiếu tới các thủ tục hoặc biến, mà chúng được dịnh nghĩa ở Modul phụ, thì nhất thiết phải có chỉ thị EXTRN để liệt kê danh sách chúng. -Ta dùng AX để khởi tạo STACK và địa chỉ đoạn dữ liệu, nhưng cũng có thể dùng các thanh ghi đa năng khác. Vì vậy, nếu chương trình của ta nhận giá trị vào của người sử dụng từ thanh ghi AX, khi đó ta bắt buộc phải dùng thanh ghi khác (ví dụ DI) để khởi tạo. -Về thủ tục: Các Pseudo_Op Proc và Endp đánh dấu điểm đầu và điểm cuối của 1 thủ tục. Thủ tục là một khối lệnh mà có thể được gọi thực hiện từ nhiều nơi trong chương trình. Nếu thủ tục kết thúc bằng lệnh RET (Return from Procedure) thì ta có thể gọi nó là một chương trình con (Subroutine). Lệnh RET làm cho MPU thực hiện chương trình đã gọi (tới thủ tục)tiếp tục thực hiện lệnh (trình tự) sau lời gọi đó. Một thủ tục luôn có một trong hai thuộc tính: NEAR và FAR được chỉ ra bởi Operand đứng ngay sau Proc directive, trong đó NEAR là ngầm định. + Proc_name PROC NEAR: thủ tục Proc_name chỉ có thể được gọi từ trong chính SEGMENT chứa thủ tục đó. Khi gặp lời gọi tới 1 thủ tục NEAR, MPU chỉ cất Offset (IP) của địa chỉ trở về lên Stack. Với chương trình dạng .COM, luôn luôn dùng NEAR. + Proc_name PROC FAR: thủ tục Proc_name có thể được gọi từ bất cứ SEGMENT nào. Khi gặp lời gọi tới 1 thủ tục FAR, MPU chỉ cất địa chỉ trở CS:IP lên Stack. Với chương trình dạng .EXE, luôn luôn dùng FAR cho thủ tục chính. II. SECONDARY Module: Mô dul phụ sau đây là mẫu modul phụ, sẽ được Linked với Main Modul ở ví dụ trên Page ,132 Title (điền các tiêu đề ở đây.) public pname (khai báo public cho các biến tại đây nếu cần thiết) dseg segment para public 'data' (đặt các dữ liệu tại đây) dseg ends cseg segment para public 'code' assume cs:cseg, ds:dseg pname proc near (đặt các lệnh ở đây) ret;trở lại chương trình gọi pname endp cseg ends end Chú ý có thể sửa đổi lại một số khai báo như sau: 1. Vì Code segment của modul phụ này có cùng tên (cseg) với tên của code segment thuộc modul chính, nên ta khai báo Pname proc near. Để gọi Pname từ segment khác, phải thay near bằng far. 2. vì data segment của modul phụ này có cùng tên với data segment của modul chính, nên ta không cần khởi tạo DS (không cần assume ds:dseg). Nếu modul phụ này dùng data segment khác tên với data segment của modul chính thì ta phải dùng pseudo op: assume ds: tên data segment dseg. 3. ở đây ta đặt tên thủ tục là Pname, khi lập chương trình của mình, ta có thể thay bằng tên theo ý ta ở các vị trí: + khai báo public ở trên đầu thủ tục + khai báo proc ở giữa + khai báo endp ở cuối 4. ở modul phụ, ta có khai báo public để tương ứng với khai báo Extrn ở modul chính. trong 2 ví dụ này, nếu modul chính gọi modul phụ, thì ở modul chính phải có khai báo extrn pname: near III. .com file DOS có thể chạy được 2 loại file chương trình viết bằng assembly language, đó là .com file và .exe file. Nói chung người sử dụng dùng .exe file khi cần tạo các chương trình lớn, dài hơn 64 KB, và dùng .com file khi cần tạo các file chương trình <= 64KB. việc tạo ra .com file cần theo một số quy tắc khác .exe file, sau đây là một số điểm quan trọng: 1. Các quy tắc để tạo ra .com file 1/ bỏ qua tất cả các stack, data và extra segments. 2/ chỉ xác định 1 code segment, nhưng để tất cả lệnh và dữ liệu vào đó 3/ ở assume pseudo-op ta trỏ tất cả 4 thanh ghi đoạn tới code segment. ví dụ cseg segment para public 'code' assume cs:cseg, ds:cseg, es: cseg, ss: cseg 4/ đặt trước điểm vào của chương trình (lệnh đầu tiên của ch tr) với chỉ thị assembler org 100h; để dành 256 byte đầu tiên cho PSP (Program segment prefix) 5/ đặt tất cả các dữ liệu trước các lệnh của ch trình. Tất nhiên trước dữ liệu phải có 1 lệnh JMP để nhảy qua vùng dữ liệu ví dụ entry: jmp our_prog source db 10,20,30,40 dest db 4 dup(?) our_prog proc near (các lệnh ...) 6/ xác định tất cả các Procedure là near (ngầm định) 7/ cuối chương trình sau END pseudo_op phải có nhãn của lệnh đầu tiên của chương trình ví dụ end entry 2. Các quy tắc tạo các modul phụ của .com file cũng tuân theo các quy tắc trên, nhưng cần lưu ý: - đặt tên cho segment ở modul phụ giống tên segment ở modul chính ví dụ tên cseg dùng ở cả modul chính lẫn phụ. - cũng giống như ở .exe file, ở lệnh END cuối modul phụ, không được viết nhãn sau END 3. Mẫu cho 1 .com file Mẫu cho 1 mô đun chính Page ,132 Title (ta để tiêu đề ở đây) (đặt khai báo Extrn tại đây nếu cần) Cseg segment Para Public 'Code' Assume cs: cseg, ds: cseg, es:cseg, ss:cseg org 100h Entry: jmp start (vùng data) Start proc near (các lệnh của thủ tục Start) ret (trở về ch trình gọi, hoặc DOS, hoặc Debug) Start endp Cseg ends end Entry Mẫu cho 1 mô đun phụ (ch trình con) của .com file Page ,132 Title (ta để tiêu đề ở đây) public Pname (đặt Public cho các biến tại đây, nếu có) Cseg segment Para Public 'Code' Assume cs: cseg, ds: cseg, es:cseg, ss:cseg jmp Pname; nhảy qua miền dữ liệu (vùng data) Pname proc near (các lệnh của thủ tục Pname) ret (trở về ch trình gọi) Pname endp Cseg ends end 3. .EXE file 4. Ưu điểm và nhược điểm của .Com files so với .exe files 4.1 ưu điểm 1) ngắn hơn hẳn so với .exe files 2) nói chung nạp vào bộ nhớ nhanh hơn .exe files 3) dễ viết hơn vì không phải khởi tạo các thanh ghi cho Stack, DS, ES 4) các ch trình thường trú phải viết dưới dạng .com 4.1 nhược điểm 1) Không thể dài hơn 64 KB 2) chúng yêu cầu phương pháp viết ch trình chặt chẽ hơn 3) vì chỉ sử dụng có 1 segment nên không có sự tách biệt hoàn toàn giữa các lệnh và số liệu 4) Không truy nhập được các thủ tục hoặc số liệu ở các segment khác, do đó rất khó sử dụng các modul được NSD khác xây dựng, nếu các modul này đặt tên cho segment mà chúng dùng khác tên segment của ta. Bài tập 3.1 Nhận vào từ bàn phím 2 con số 8 bit, không dấu (số dương), in ra màn hình tích của chúng. ;BT3_1.ASM Get in 2 un_sign 8 bit number2 (0=< and <= 255) ;Then print out the product CODE_SEG SEGMENT BYTE PUBLIC ASSUME CS:CODE_SEG, DS:CODE_SEG ORG 100H START: JMP FIRST MSG DB "Enter 2 number (0 =< x <= 255):$" MSG1 DB "number 1:$" MSG2 DB "number 2:$" msg3 DB "The Product is: $" NUMBER_1 DB 0 NUMBER_2 DB 0 RESULT LABEL BYTE PRODUCT DW 0 FIRST: MOV AH,09H MOV DX,OFFSET MSG INT 21H CALL CR_LF MOV AH,09H;ask for the 1st number MOV DX,OFFSET MSG1 INT 21H call Get_an_Int_num CMP Ax,255 Ja EXIT mov number_1,al CALL CR_LF MOV AH,09H;ask for the 2nd number MOV DX,OFFSET MSG2 INT 21H call Get_an_Int_num CMP Ax,255 JA EXIT mov number_2,al CALL CR_LF mov bl,number_1 mul bl PUSH ax MOV AH,09H MOV DX,OFFSET MSG3 INT 21H pop ax CALL WRITE_INT_NUMBER EXIT: INT 20H ;-------------------------------------------------------------------------- ;This procedure get in an integer number between 0..255 ;Return it to calling prog. in AX ;-------------------------------------------------------------------------- Get_an_Int_num PROC; 0 <= X <= 255 jmp $+4 temp_var Dw 0 push bx push cx push dx xor dx,dx mov temp_var,0 mov cx,1;CX counts digits typed in loop_2: Call Get_a_dec_digit cmp al,0Dh je exit_2 sub al,30h xor ah,ah mov dx,ax mov ax,temp_var cmp cx,1 je sum_up mov bl,10 push dx mul bl pop dx sum_up: add ax,dx ; cmp ax,255 ; ja exit_2 mov temp_var,ax inc cx CMP CX,3 JA EXIT_2 jmp loop_2 exit_2: mov ax,temp_var pop dx pop cx pop bx ret Get_an_Int_num ENDP ;-------------------------------------------------------------------------- ;This procedure gets in a decimal digit between 0..9 ;checks input for digit ;Return it to calling prog. in AL ;-------------------------------------------------------------------------- Get_a_dec_digit PROC loop_1: push dx mov ah,08 int 21h cmp al,0Dh je exit_1 cmp al,30h jb loop_1 cmp al,39h ja loop_1 mov dl,al mov ah,02 int 21h exit_1: pop dx ret Get_a_dec_digit ENDP ;-------------------------------------------------------------------------- ;This Prog. will Write out an Integer number in AX (Int number) ;let refer to example in 'Nhap mon Assembler', Peter norton, Pg 83. WRITE_INT_NUMBER PROC NEAR MOV BX,10 XOR CX,CX NONE_ZERO: XOR DX,DX DIV BX PUSH DX INC CX OR AX,AX JNZ NONE_ZERO WRITE_DIGIT_LOOP: POP DX ADD DL,'0' MOV AH,02 INT 21H LOOP WRITE_DIGIT_LOOP RET WRITE_INT_NUMBER ENDP ;-------------------------------------------------------------------------- CR_LF PROC NEAR PUSH AX PUSH DX MOV AH,02 MOV DL,13 INT 21H MOV DL,10 INT 21H POP DX POP AX RET CR_LF ENDP ;-------------------------------------------------------------------------- CODE_SEG ENDS END START Bài giảng môn Assembly Language, Bài 3 - $ - Nguyễn Đình Việt, Khoa CNTT, ĐHQGVN,HN 1995 --------------------------------------------------------------------------- Bài 5 Các thao với File TLTK: 1. Assembly Language for Pascal Programmers; Steven Holzner, Brady Page 71 2. PC Intern System Programming, Michael Tischer, Chapter 19 Mục đích của tính toán là tạo ra các OUTPUT có thể sử dụng được bên ngoài chương trình. Output lên màn hình là một trong các phương pháp như vậy, nhưng sử dụng File rất quan trọng vì nó là bộ nhớ ngoài, có thể lưu trữ thông tin ngay cả khi tắt máy. Ta có thể in ra một File, có thể tổ chức một file để lưu giữ dữ liệu và các ký tự cho 1 Editor, file có thể là chính chương trình. DOS có một bộ dịch vụ về File rất phong phú, phần lớn là các dịch vụ trong INT 21h. Các Service của INT 21h represent most of the resources mà những người lập trình sử dụng trong DOS. Bên cạnh INT 20h (kết thúc chương trình) và các ngắt cho phép đặt một chương trình thường trú, những ngắt khác thực sự cần thiết là các ngắt cho phép đọc/ghi đĩa, INT 25h và INT 26h. Trong khi đó số lượng các Service của INT 21h không ngừng tăng lên, ở DOS version 4.0 con số đã lên tới 6Ch (=108d). I. File Control Blocks (FCB) Trước DOS 2.0, DOS thường làm việc với File thông qua FCBs. FCBs giữ các thông tin về file: Filename, tên ổ đĩa chứa file, kích thước file. Tuy nhiên FCBs hạn chế độ dài tối đa của File là 11 character. Từ DOS 2.0 trở đi, IBM đưa ra Directory và vì vậy cần phải chỉ ra đường dẫn tới file, tất nhiên 11 ký tự nói chung là không đủ, đó là lý do mà File handles đã được IBM (và Microsoft) đưa ra. II. File handles Một File handle là một từ 16 bit làm đại diện cho 1 file trước DOS (A file handle is a 16-bit word that stands, to DOS, for a file.) Khi chúng ta muốn sử dụng một file, ta trao cho DOS filename còn DOS thì trả lại một File handle trong một thanh ghi (thường là AX). Khi chúng ta muốn làm một việc gì đó với file - rename file, open file, read from file ... thì dịch vụ của INT 21h sẽ cần file handle 16 bit đó trong một thanh ghi nào đó (thường là BX). Trình tự điển hình để Copy một file rất giống với trong ngôn ngữ lập trình Pascal - ta sẽ mở, đọc, ghi và đóng file lại - ngưng ta sẽ sử dụng DOS chứ không phải là PASCAL ở đây. Ta thực hiện công việc đó như sau: - tạo một xâu ký tự tên file (ASCIIZ string) trong bộ nhớ, ví dụ: FILE_36 DB "C:\Novel\Chapter.89",0 - mở file và lấy file handle cho nó (INT 21h service 3Dh). - tạo một file mới (INT 21h service 3Ch). - đọc từ file nguồn (file thứ nhất) (INT 21h service 3Fh). - viết vào file mới (file đích hay file thứ hai) (INT 21h service 40h). - sau đó đóng cả hai file lại (INT 21h service 3Eh). service 3Fh giống như Read() service 40h giống như Write() Cũng giống như trong Pascal, chúng ta có thể coi các thiết bị (devices) như các file logic. Đặc biệt chúng ta có thể sử dụng Predefined handle để truy cập tới các thiết bị vật lý khác nhau. Sau đây là một số Predefined handles: handle Device 0 Standard Input (STDIN), usually keyboard 1 Standard Output (STDOUT), usually screen 2 Standard Erro device (STDERR) 3 Standard Auxiliary device (STDAUX) 4 Standard Printer Thí dụ, nếu chúng ta chọn service 40h và trao giá trị 04h cho file handle thì Output sẽ đi ra máy in. II. Các dịch vụ file handle của DOS và các mã lỗi (error codes) 1. Các dịch vụ File Handle Có rất nhiều dịch vụ file handle của DOS, sau đây là một số service: File Handle Service Number You set It Returns --------------------------------------------------------------------- Create Subdirectory 39h DS:DX to ASCIIZ if CY=1, AX chứa mã lỗi string Delete Subdirectory 3Ah DS:DX to ASCIIZ if CY=1, AX chứa mã lỗi string Change Directory 3Bh DS:DX to ASCIIZ if CY=1, AX chứa mã lỗi string Create File 3Ch DS:DX to ASCIIZ if CY=1, AX chứa mã lỗi string if CY=0 CX= Attribute Open File 3Dh DS:DX to ASCIIZ if CY=1, AX chứa mã lỗi string if CY=0, AX=File handle AL=mode Close File 3Eh BX=File handle if CY=1, AX chứa mã lỗi Read from File 3Fh BX=Handle if CY=1, AX chứa mã lỗi CX=#Byte wanted if CY=0, AX=#Byte read DS:DX=Buffer Write to File 40h BX=Handle if CY=1, AX chứa mã lỗi CX=#Byte wanted DS:DX=Buffer Delete a File 41h DS:DX to ASCIIZ if CY=1, AX chứa mã lỗi string Move Read/Write pointer 42h CX:DX=#Bytes to if CY=1, AX chứa mã lỗi move if CY=0, DX:AX=new BX=File Handle location in file. AL="Methode" Find 1st Matching file 4Eh DS:DX to ASCIIZ if CY=1, AX chứa mã lỗi CX=Attribute if CY=0 then DTA has 21 bytes reserved 1 byte: file's attrib. 1 word: file's time 1 word: file's date 1 Dword: file's size 13 byte: ASCIIZ name Find next Matching file 4Fh DTA as set same as for 4Eh by service 4Eh Rename File 56h DS:DX to ASCIIZ if CY=1, AX chứa mã lỗi ES:DI to new name (also ASCIIZ) --------------------------------------------------------------------- Còn có rất nhiều Serice khác nữa, trong đó có các Service tạo các file tạm (temporary file), lấy hoặc đặt lại các thuộc tính Date, Time của file ... 1.1. Các mã lỗi trả về trong AX (Error Codes) Trong DOS version 4.0 có 91 mã lỗi khác nhau, ở các version sau này con số đó còn lớn hơn. Sau đây là một số mã lỗi thường gặp: Error codes Means 1 Invalid function number 2 File not found 3 Path was not found 4 Too many files open at once 5 Access denied for this operation 6 File handle used is invalid 7 Memory Control Blocks destroyed 8 Insufficient memory 15 Invalid drive was specified 16 Cannot delete current directory 19 Cannot write on a write-protected diskette 21 Drive not ready 23 Disk data error 25 Disk seek error 27 Sector not found 28 Printer needs paper 29 Write fault 30 Read fault 61 Print queue is full 1.2. File Access Modes Mode truy cập file được truyền qua AL, có các Mode sau: Access Mode for Opening Files Means 0 Open file for Read only 1 Open file for Write only 2 Open file for both Read and Write 1.3. Các thuộc tính của File (không được là tên nhãn đĩa) truyền qua CX File Attribute Means 0 Plain old file 1 Read-Only 2 Hidden File (Hidden from directory searches) 4 A System file 8 Used for the Volume label of a Disk 10 This file name is the name of a subdirectory 1.4. Cách dịch chuyển Read/Write Pointer khi dùng service 42h ( Methods for INT 21h Service 42h) Method (in AL) Means 0 Set R/W pointer to CX:DX bytes from the beginng of the file 1 Move R/W pointer CX:DX bytes from where it is now 2 Set R/W pointer to CX:DX bytes from end of file Note: Vị trí mới của R/W pointer được trả về trong DX:AX if CF=CY=1, mã lỗi trả về trong AX 2. Chương trình thí dụ Program RUBOUT Đây là một chương trình đơn giản nhất - xoá một file, sử dụng Service 41h. Service này không đòi hỏi 1 file handle để xoá file, nó chỉ cần một ASCIIZ string cho tên file (có cả đường dẫn). ;------------------------------------------------------------------------- ;Program Rubout.asm it will delete a file by specifying file name ;------------------------------------------------------------------------- Code Segment Assume CS:Code, DS: Code org 100h start: jmp rubout the_buffer db 50 byte_typed db 0 characters db 50 dup(0) prompt db "File to delete ? $" ok_message db "File deleted $" not_ok_message db "File NOT deleted $" rubout proc near mov dx, offset prompt mov ah,9 int 21h mov AH,0AH mov dx, offset the_buffer int 21h mov bh,0 mov bl, byte_typed add bx, offset characters mov byte ptr[bx],0 mov dx, offset characters mov ah,41h int 21h jnc all_ok mov dx, offset not_ok_message jmp print all_ok: mov dx, offset ok_message print: mov ah,09 int 21h exit: int 20h rubout endp end start 3. Chương trình minh hoạ: Program BACK.ASM Đây là chương trình minh hoạ cách thức mà Assembly language có thể làm việc với data của file. Chương trinh này sẽ tạo một file lưu kiểu .BAK của một file đã có trên đĩa do ta chỉ định tên của file đó ra. Thí dụ, nếu ta chạy BACK.COM rồi chỉ ra tên 1 file NOVEL.ONE thì BACK.COM sẽ tạo ra một file mới NOVEL.BAK là bản sao của file trên. BACK.COM chỉ là một chương trình minh hoạ, trong đó tất cả mã lệnh của chương trình và dữ liệu mà nó đọc từ file nguồn (chỉ đọc một lần) đều đặt trong một đoạn, chính vì vậy mà file nguồn làm ví dụ phải có kích thước hạn chế <= 60 KB. Tất nhiên ta có thể cải tiến thêm một chút để BACK.COM có thể COPY các file kích thước tuỳ ý. Ngoài ra để đơn giản hoá chương trình, tên file đưa vào sẽ không có đường dẫn. Việc sử dụng file handle để làm việc với file giúp ta có thể làm việc trực tiếp với data của file, không còn lớp đệm (buffer) trung gian nữa, ta có thể đọc bao nhiêu byte tuỳ ý, chẳng hạn 12 bytes, 279 bytes ... 3.1 Stack của file .COM (The .COM file stack) Đây là một điểm quan trọng khi ta thao tác với một lượng số liệu lớn, thí dụ như khi copy file. DOS sử dụng stack để chứa địa chỉ trở về khi nó gặp một lệnh CALL; chúng ta dùng stack cùng với các lệnh PUSH, POP để lưu giữ các thông tin trạng thái, stack của .COM file cùng nằm trong một segment với mã lệnh và data. - Trong segment của chương trình .COM, stack nằm ở trên cùng (phía địa chỉ cao nhất). địa chỉ hiện thời của stack luôn được trỏ bởi SS:SP Khi bắt đầu chương trình SP luôn trỏ tới FFFE nghĩa là cách đỉnh của segment 1 word. Stack có kích thước thay đổi tuỳ theo hoạt động của chương trình, khi stack lớn lên (sau một lệnh PUSH chẳng hạn) nó phát triển xuống phía dưới (nghĩa là SP giảm đi) từng word một. - con trỏ stack bổ sung là BP (Auxilary stack pointer) - điều cực kỳ quan trọng là chương trình không được viết vào stack, nếu không chương trình sẽ bị phá huỷ (crash). Nói chung ta sẽ không được viết gì vào miền 256 byte cao nhất (Top) của segment để tránh viết đè vào stack. 3.2 Chương trình BACK.ASM (số dòng được ghi chỉ để tiện phân tích) CODE SEGMENT 1 ASSUME CS: CODE, DS: CODE 2 ORG 100H 3 START: JMP BACK 4 THE_BUFFER DB 13;tạo buffer 13 byte cho INT 21h, 5 BYTE_TYPED DB 0;service 0AH 6 FILE_ONE DB 12 DUP(0) 7 MAKE_ME_ZERO DB 0;byte cuối của ASCIIZ string 8 FILE_TWO DB 8 DUP(0), ".BAK",0 9 HANDLE_1 DW 0 10 HANDLE_2 DW 0 11 PROMPT DB "Filename to back up: $" 12 BACK PROC NEAR 13 MOV DX, OFFSET PROMPT 14 MOV AH, 9;write out a string ended with '$' 15 INT 21H;pointed to by DS:DX 16 MOV AH, 0AH 17 MOV DX, OFFSET THE_BUFFER;read in a string 18 INT 21H;and store at [DS]:[DX] 19 MOV MAKE_ME_ZERO, 0;overwrite CR character (0Dh) 20 MOV CX, 8 21 MOV SI, OFFSET FILE_ONE 22 MOV DI, OFFSET FILE_TWO 23 REP MOVSB 24 MOV DX, OFFSET FILE_ONE;OPEN 1ST FILE 25 MOV AX, 3D00H;AL=0 means open file for read only 26 INT 21H 27 MOV HANDLE_1, AX 28 MOV DX, OFFSET FILE_TWO 29 MOV AH, 3CH;CREATE BACKUP FILE 30 MOV CX, 0;CX=0 (attrib) means Plain old file 31 INT 21H 32 MOV HANDLE_2, AX 33 MOV AH, 3FH 34 MOV CX, 60*1024 35 MOV DX, OFFSET DATA 36 MOV BX, HANDLE_1 37 INT 21H 38 MOV CX, AX;set number of bytes to write to number 39 MOV AH, 40H;actually read. 40 MOV BX, HANDLE_2 41 INT 21H 42 MOV AH, 3EH 43 MOV BX, HANDLE_1 44 INT 21H 45 MOV BX, HANDLE_2 46 INT 21H 47 EXIT: INT 20H 48 BACK ENDP 49 DATA: 50 CODE ENDS 51 END START 52 - các dòng từ 5..12 dành một số byte để chứa tên file mà chương trình nhận vào, tên file mới sẽ tạo ra, dòng ký tự nhắc (prompt), 2 words để chứa File handle của 2 file nguồn và đích. 3.3 Mở file nguồn để đọc, tạo file mới để chép file nguồn sang - các dòng 25..28 mở file nguồn ở MODE Read Only (sau khi đã nhận vào tên file từ bàn phím), lưu File handle của nó vào word có tên Handle_1 để sử dụng khi đóng file lại. - các dòng 29..33 tạo một file mới bằng service 3Ch, với thuộc tính CX=0 (plain old file), nghĩa là mở để đọc, ghi, lưu File handle của nó vào word có tên Handle_1 để sử dụng khi đóng file lại. nếu đã tồn tại một file trùng tên thì file đã tồn tại bị cắt giảm kích thước = 0 , nếu file đó có thuộc tính read only thì tác vụ 3Ch này thất bại. Tham khảo thêm: nếu muốn lấy/đặt thuộc tính của file thì sử dụng service 43h, INT 21h (CHMOD), như sau: input AH:= 43H AL:= SubFunction = 0: lấy thuộc tính file hiện hành := SubFunction = 1: đặt thuộc tính file DS:DX:= ASCIIZ filename nếu AL:= 0 Attribute nếu AL:= 1 nếu không có tên ổ đĩa và đường dẫn thì ngầm định là ổ đĩa và đường dẫn hiện thời. return AX = mã lỗi nếu CF=CY CX = attrib. của file hiện thời, nếu AL khi gọi = 0 - dòng 50 chỉ là một nhãn, ta dùng nó để chuẩn bị miền chứa data từ file nguồn sẽ được đọc vào. Nhãn DATA: này cần đặt ở cuối cùng của chương trình, nhưng vẫn phải nằm bên trong cùng segment với chương trình, do đó phải đứng trước Pseudo-Op CODE ENDS Việc dùng một nhãn bên ngoài thủ tục (DATA: đứng sau BACK ENDP) có nghĩa là tất cả dữ liệu của ta sẽ ghi vào ngay sau chương trình trong bộ nhớ, trên cùng một segment. Chúng ta không cần dành chỗ cho DATA bằng Directive DATA DB bởi vì sau chương trình chúng ta có thể sử dụng toàn bộ phần còn lại của segment, miễn là không dụng chạm đến Stack. Nếu chúng ta làm ngược lại, sử dụng DATA DB và sau đó là các byte để dành cho dữ liệu thì chương trình của chúng ta bao gồm cả các byte để dành đó, tất nhiên là lớn hơn và hoàn toàn không cần thiết như vậy. 3.4 Việc đọc từ File Trong ngôn ngữ lập trình PASCAL có 3 loại file: TEXT, TYPED, UNTYPED. Trong TEXT FILE chúng ta sẽ tìm thấy (0Dh 0Ah) ứng với vị trí cuối mỗi dòng. Các file có định kiểu chỉ chứa dữ liệu của một kiểu cụ thể, kiểu đó ta phải khai báo trước. Các file không định kiểu là các file không có cấu trúc và có thể xem chúng như là bao gồm các byte không có liên hệ gì đến nhau cả. Trong assembly language việc sử dụng tất cả các loại file đều giống như việc sử dụng file không định kiểu trong PASCAL. - các dòng lệnh 34..38 (đọc từ file nguồn) MOV AH, 3FH 34 MOV CX, 60*1024 35 MOV DX, OFFSET DATA 36 MOV BX, HANDLE_1 37 INT 21H 38 chúng ta không biết file nguồn dài bao nhiêu vì vậy ta yêu cầu đọc số lượng byte lớn nhất có thể được (60 KB), service 3Fh sẽ đọc số byte lớn nhất có thể đọc được (cho đến khi gặp dấu END OF FILE), sau khi đọc xong nó sẽ trả về AX số byte thực sự đọc. Con số này ta sẽ sử dụng để báo cho service 40h (Write to file) số byte cần ghi. Đây là cách chúng ta sẽ thường làm khi làm việc với File trong Assembly language. Tất nhiên ta có thể tính toán ra kích thước file nhưng không nhất thiết phải làm như vậy. 3.5 Việc ghi vào File đích Ta sẽ sử dụng Service 40h, INT 21h để ghi vào file đích. Vì dữ liệu của cả 2 file nguồn và đích đều không định kiểu, ta chỉ cần quan tâm tới số byte chứ không có vấn đề số dòng hay số phần tử của một kiểu nào đó như các file kiểu text hay record ... trong PASCAL. MOV CX, AX;set number of bytes to write to number 39 MOV AH, 40H;actually read. 40 MOV BX, HANDLE_2 41 INT 21H 42 3.6 Đóng file sử dụng service 3Eh, INT 21h MOV AH, 3EH 43 MOV BX, HANDLE_1 44 INT 21H 45 MOV BX, HANDLE_2 46 INT 21H 47 4. File có định kiểu trong ASSEMBLY LANGUAGE - File of Records Trong các version DOS trước đây khi các thao tác file sử dụng FCBs, NSD quy định kích thước Record và kích thước khối byte (đọc/ghi). Khi sử dụng file handle chúng ta chỉ phải chọn số byte cho thao tác đọc/ghi ... Như vậy, thực tế với assembly language chỉ có 1 kiểu file - file không định kiểu, trong đó mỗi phần tử là một byte. Tuy nhiên với người lập trình assembler có thể tổ chức file như kiểu File of Records trong PASCAL. 4.1 File of Records Giả sử chúng ta cần tổ chức một file dữ liệu chứa Tên và số Phone tương ứng của một số người. Ta có thể coi đó là 2 field của 1 record như trong PASCAL. Ta có thể định nghĩa một Record như vậy trong MEMORY như sau: NAME DB 16 DUP(0) NUMBER DB 16 DUP(0) như vậy mỗi record dài 32 byte, bắt đầu bằng nhãn NAME. Ta có thể tạo nhiều Record như thế trong bộ nhớ, điều cần chú ý là với các Record mà số liệu của các Field ngắn hơn ta định, chúng ta cần điền 0 vào để đảm bảo cho tất cả các Record có chiều dài bằng nhau. Chính nhờ kích thước các Record bằng nhau mà ta có thể truy cập đến một record tuỳ ý một cách dễ dàng (RANDOM ACCESS) thông qua STT của nó. Nếu chúng ta dùng Record có chiều dài thay đổi thì chúng ta phải ghi các dấu hiệu End of Record vào trong file làm ranh giới giữa các record. Trong PASCAL đó là cặp CR,LF. Chính vì lý do này khi cần truy cập một record nào đó ta phải duyệt từ đầu để đếm số record, cách truy cập đó được gọi là Truy cập tuần tự (Sequential Access). Để viết record trong bộ nhớ vào file, trước hết cần mở (open) hoặc tạo (create) file, cho DS:DX trở tới NAME, CX:= số byte cần ghi (ở đây là 32 byte). 4.2 Đọc số liệu từ file - con trỏ đọc/ghi (Read/Write Pointer) Tại mỗi thời điểm ta có thể đọc/ghi tại một vị trí nào đó trong file, ta có thể coi đó là 'Cửa sổ file' hay 'cửa sổ đọc/ghi', vị trí đó được trỏ bởi Read/Write Pointer, DOS có Service 42h cho phép ta định vị con trỏ này tới một vị trí tuỳ ý trong file. File Handle Service Number You set It Returns --------------------------------------------------------------------- Move Read/Write pointer 42h CX:DX=#Bytes to if CY=1, AX chứa mã lỗi move if CY=0, DX:AX=new BX=File Handle location in file. AL="Methode" Method (in AL) Means --------------------------------------------------------------------- 0 Set R/W pointer to CX:DX bytes from the beginng of the file 1 Move R/W pointer CX:DX bytes from where it is now 2 Set R/W pointer to CX:DX bytes from end of file Note: Vị trí mới của R/W pointer được trả về trong DX:AX if CF=CY=1, mã lỗi trả về trong AX Khi đã biết kích thước (bytes) của Record ta có thể định vị nó như sau: vị trí (bytes) = số thứ tự Record x kích thước Record (stt đếm từ 0, kích thước tính bằng Byte) 5. Chương trình minh hoạ: PROGRAM PHONE.ASM Chúng ta giả sử đã có file NUMBER.DAT chứa các record như mô tả ở trên, mỗi record dài 32 byte, gồm 2 field, mỗi field dài 16 byte. Field 1 chứa tên, Field 2 chứa số phone của tên tương ứng. Nếu trên đĩa thực hành chưa có NUMBER.DAT, ta có thể sử dụng DEBUG tạo ra một cách nhanh chóng như hướng dẫn sau đây, chỉ cần tạo ra 3 record để thử là được, ngoài ra ta dùng một 'mẹo vặt' để sử dụng INT 21h, service 09h để in ra trường tên một cách thuận lợi, bằng cách điền đầy 3 x 32 byte của miền nhớ sẽ chứa 3 record các ký tự '$', sau đó mới đưa nội dung của 3 record vào. Hãy làm theo các bước sau: - DEBUG - F 100 15F "$" ; - D 100 ; - A100 ; - XXXX:0100 DB "Bo Mon Tin hoc" ; - XXXX:010E - A110 - XXXX:0110 DB "581 530" - XXXX:0117 - A120 - XXXX:0120 DB "Toan Co Tin hoc" - XXXX:0117 - A130 - XXXX:0130 DB "581 135" - XXXX:0137 - A140 - XXXX:0140 DB "TAXI PT" - XXXX:0147 - A150 - XXXX:0150 DB "533 171" - XXXX:0157 Sau đó ghi vào file NUMBER.DAT bằng cách mà chúng ta biết khi học sử dụng chương trình DEBUG. CODE SEGMENT ASSUME CS: CODE, DS: CODE ORG 100H START: JMP PHONE FILENAME DB "NUMBER.DAT",0 FILEHANDLE DW 0 PERSON_NAME DB 16 DUP(0) NUMBER DB 16 DUP(0) PROMPT DB "Get phone number (1..3) or Quit (Q): $" PHONE PROC NEAR MOV DX, OFFSET FILENAME MOV AL, 0;Read Only MOV AH, 3DH;Open File INT 21H MOV FILEHANDLE, AX ASK: MOV DX, OFFSET PROMPT MOV AH, 9;Write out a string pointed to by DS:DX INT 21H MOV AH, 1;Get into AL a typed in character INT 21H CMP AL, 'Q' JE QUIT SUB AL, "0" MOV CL, 5 DEC AL SHL AL, CL;Multiply AL by 2 to the power of 5 (32) MOV CX, 0 MOV DH, 0 MOV DL, AL MOV AH, 42H;Move Read/Write Pointer MOV AL, 0;Set Methode to 0: set R/W Pointer to CX:DX bytes MOV BX, FILEHANDLE; from the beginning of the file INT 21H MOV DX, OFFSET PERSON_NAME MOV BX, FILEHANDLE MOV CX, 32;Bytes wanted MOV AH, 3FH;Read from a file INT 21H MOV AH, 9;Write out a string pointed to by DS:DX MOV DX, OFFSET PERSON_NAME INT 21H MOV DX, OFFSET NUMBER INT 21H JMP ASK QUIT: MOV BX, FILEHANDLE MOV AH, 3EH;Close a file INT 21H EXIT: INT 20H PHONE ENDP CODE ENDS END START Chương trình này hoàn toàn nhằm mục đích minh hoạ các thao tác với File of Record, giao diện với NSD hết sức 'thô sơ', các xâu ký tự in ra màn hình liên tiếp nhau, thiếu cả dấu xuống dòng. Có thể thêm dấu xuống dòng sau mỗi lần in ra màn hình một xâu ký tự bằng các cách sau: 1/ in ra xâu ký tự CR_LF như sau: CR_LF DB ODh, 0Ah, "$" sử dụng INT 21h, Service 09. 2/ xây dựng 1 thủ tục CR_LF in dấu xuống dòng, bảo vệ các thanh ghi trước khi thực hiện và phục hồi lại chúng trước khi trở về (RET). CODE SEGMENT BYTE PUBLIC ASSUME CS:CODE CR_LF PROC NEAR PUSH AX PUSH DX MOV AH,2;DOS ah=function 02h MOV DL,0DH INT 21H MOV DL,0AH INT 21H POP DX POP AX RET CR_LF ENDP CODE ENDS END Bài giảng môn Assembly Language, Bài 5 - $ - Nguyễn Đình Việt, ĐHQG HN, 1995 ------------------------------- Bài 6 Quản lý màn hình và Đồ hoạ nhanh ( SCREEN HANDLING AND FAST GRAPHICS ) Trong ngôn ngữ lập trình PASCAL có rất nhiều thủ tục và hàm phục vụ cho các thao tác trên màn hình, kể cả trong chế độ đồ hoạ. Tuy nhiên hầu hết các chức năng màn hình đều chạy khá chậm. Trong Assembly Language thì vấn đề lại ngược lại: có quá ít dịch vụ hỗ trợ chế độ đồ hoạ (không kể trong OS/2 Presentation Manager), tuy nhiên tốc độ lại rất cao - nhất là khi ta viết trực tiếp vào vùng nhớ màn hình. Việc hiển thị trên màn hình PC không ngừng được cải thiện, đã có một số tiêu chuẩn về màn hình đồ hoạ như: MDA, CGA, EGA, VGA và HERCULES, chưa có một tiêu chuẩn nào được coi là duy nhất. Ngay cả các CARD mới ra đời như Super VGA, TIGA cũng chưa có tiêu chuẩn duy nhất. Sau đây trình bày về các loại VIDEO GRAPHICS CARD - Monochrome Display Adapter (MDA), cùng với CGA là những Graphics Adapter đầu tiên mà IBM đưa ra như là những chuẩn trong các máy PCs đầu tiên trong năm 1981. + chỉ có 1 Mode hoạt động là TEXT MODE 80x25 + độ phân giải cao 720 x 350, không bị nhấp nháy. + MDA sử dụng bộ nhớ hiển thị 4 KB, chỉ có 1 trang. + Sử dụng VIDEO CONTROLLER Motorola MC6485 giống CGA CARD - Color Graphics Adapter (CGA), được IBM đưa ra thị trường cũng trong năm 1981, có khả năng hiển thị đồ hoạ. + có thể hiển thị 4 màu 1 lúc, chọn 4 màu trong số 16 màu ở độ phân giải là 320 x 200; cảm giác nhấp nháy khá rõ. + Độ phân giải cao nhất là 640 x 200, nhưng chỉ có 2 "màu". + Có TEXT MODE với các ký tự là các ma trận điểm tối thiểu. + CGA sử dụng bộ nhớ hiển thị 16 KB + Có thể nối màn ảnh máy thu hình với đầu ra của CGA CARD. + Sử dụng VIDEO CONTROLLER Motorola MC6485 giống MDA CARD - Hercules Graphics Card (HGC) Năm 1982, một năm sau khi IBM PC ra đời, hãng Hercules đưa ra CARD đồ hoạ mới mang tên hãng mình và trở thành nổi tiếng. HGC được coi là 1 chuẩn trong các CARD đồ hoạ Monochrome. + Chế độ Graphics có độ phân giải 720x348, có 2 trang màn hình. + Dựa trên VIDEO CONTROLLER Motorola MC6485, hoàn toàn tương thích với MDA. - Enhanced Graphics Adapter (EGA) Sau khi HGC ra đời, IBM cố gắng thiết kế 1 CARD mới thay cho CGA và vượt các tính năng của HGC. Năm 1985 IBM cho ra đời EGA. Có các tính năng bao trùm CGA và MDA, ngoài ra còn có các MODE riêng. + Đây là loại CARD đồ hoạ đầu tiên có thể điều khiển hiển thị cả màn hình đơn sắc lẫn màn hình màu. + Có khả năng hiển thị đơn sắc trên màn hình đơn sắc, do đó nó giống như HGC. Tất nhiên EGA CARD khi nối ghép với màn hình EGA thì hiệu quả là cao nhất. + Độ phân giải 640x350 pixels , có thể hiển thị cùng một lúc 16 màu trong số 64 màu, màn hình EGA không nhấp nháy. + EGA sử dụng bộ nhớ hiển thị có thể lớn tới 256 KB để hiển thị các trang màn hình đồ hoạ khác nhau. + Không sử dụng VIDEO CONTROLLER Motorola MC6485 mà sử dụng VLSI Chips. Mọi thông tin màn hình đều chứa trong VIDEO RAM, đây là điểm tiến bộ hơn hẳn của EGA so với các CARD ra đời trước nó. + Một điểm khác biệt quan trọng của EGA so với MDA, CGA là nó không được IBM ROM BIOS hỗ trợ, vì vậy EGA CARD có ROM BIOS riêng của nó thay thế cho BIOS nguyên thuỷ (original) của IBM, cho phép truy cập tới tất cả các tính năng (features) của EGA CARD. - VGA (VIDEO GRAPHICS ARRAY) Tháng 4 năm 1987, IBM cho ra đời VGA cùng với việc cho ra đời họ máy PS/2. VGA CARD có tất cả các ưu điểm của EGA, hơn nữa nó có thể thể hiện được nhiều màu sắc hơn, độ phân giải cao hơn, hiển thị TEXT tốt hơn. + Ưu điểm của VGA so với EGA là mức độ tổ hợp (của mạch điện tử) cao hơn, tất cả các khối logic điều khiển được tổ hợp trong 1 chip. + khác với EGA, VGA CARD gửi tiến hiệu analog tới monitor chứ không phải tín hiệu số, VGA CARD có thể sinh ra hơn 260,000 màu khác nhau trong trường hợp các MODE 2,4,16,256 cùng active. + Độ phân giải cao nhất: 640 x 480 ,số màu có thể thể hiện là 2,4 hay 16. + ở độ phân giải thấp (320 x 200) VGA có thể hiển thị đồng thời 256 màu được chọn trong 256 x 1024 màu có thể. + RAM VIDEO: Độ phân giải cao, số màu hiển thị lớn đòi hỏi RAM VIDEO cũng lớn theo, minimum là 256 KB , MAX là 512 KB. + Giống như EGA, VGA không được IBM ROM BIOS hỗ trợ, vì vậy VGA CARD có ROM BIOS riêng của nó thay thế cho BIOS nguyên thuỷ (original) của IBM, cho phép truy cập tới tất cả các tính năng (features) của VGA CARD. - Super VGA Super VGA Card có cấu trúc phần cứng giống như VGA Card thông thường, nhưng nó hiển thị Pixel nhanh hơn. Lưu ý: Các CARD màn hình của IBM luôn luôn bị các hãng khác, đặc biệt là các hãng ở Châu á Copy, họ đưa ra các CARD tương thích để cạnh tranh, các CARD này thường có các MODE bổ sung và rất có thể các MODE này không được nhiều phần mềm hỗ trợ. Bài này sẽ chủ yếu khám phá BIOS INT 10H, xem xem Assembly Language có thể làm tốt những việc gì trên màn hình. BIOS INT 10H chứa các dịch vụ màn hình mà các chương trình Assembly Language phải dùng đến. Tất nhiên có một số Function của INT 21h cũng in được ký tự ra màn hình nhưng nó cũng gọi INT 10H ra thực hiện mà thôi. BIOS nói chung là phần mềm trong ROM nhưng ngày nay thường được tăng cường bằng các phần mềm bổ sung nạp vào từ các file đĩa. Điều rất cần nhớ là sau khi gọi INT 10H các thanh ghi sau nói chung sẽ bị phá huỷ (giá trị trong đó): AX, SI, DI I. Các dịch vụ màn hình của BIOS trong chế độ TEXT (The BIOS Screen Handling Services) Chế độ này còn có tên gọi Alphanumeric-Mode BIOS và DOS đều có các dịch vụ in ký tự lên màn hình, nhưng BIOS có thể làm được nhiều việc mà DOS không làm được, thí dụ: - in các ký tự có màu - viết vào Screen Buffer - thay đổi thuộc tính của ký tự - di chuyển con trỏ trên màn hình, cuộn màn hình ... Trang màn hình (Video Memory Page) Vùng nhớ giành cho màn hình trong một số Video Mode có thể được chia thành các trang. Một Video Adapter thường kèm theo một lượng bộ nhớ nhất định, hơn nữa Adapter này có thể làm việc ở một số Mode khác nhau, các Mode khác nhau cần dung lượng nhớ tương ứng khác nhau, do vậy trong một số Mode còn một số lượng nào đó của bộ nhớ Video chưa được sử dụng, IBM cho phép ta sử dụng bộ nhớ đó như các trang thêm vào (Extra Pages) của bộ nhớ hiển thị. Thí dụ CGA Adapter trong chế độ đồ hoạ cần 16 KB còn trong chế độ TEXT chỉ cần có 4 KB, do vậy vùng nhớ Video của CGA có thể chia thành 4 trang trong chế độ TEXT. Bình thường thì cả 4 trang này là các bản copy của nhau và Page 0 được hiển thị. Với BIOS ta có thể lựa chọn để viết vào trang nào là tuỳ ý, trang được ngầm định sử dụng là trang số 0. 1. Service 2,3: đặt và lấy vị trí của con trỏ trên màn hình lưu ý rằng góc trên bên trái của màn hình có toạ độ Row,Column = 0,0 1.1 Đặt vị trí con trỏ trên màn hình (Set cursor position) AH:= 2;SERVICE NUMBER DH,DL:= Row, Column of new position BH:= Page Number (usually = 0) service này giống như Gotoxy(x,y) trong PASCAL 1.2 Lấy vị trí con trỏ trên màn hình (Get cursor position) AH:= 3;SERVICE NUMBER BH:= Page Number (usually = 0) Return: DH,DL:= Row, Column of current cursor position service này giống như WhereX,WhereY trong PASCAL Service này rất hữu ích khi ta viết Popup Program, nó cần xác định vị trí Cursor trước và sau khi nó thực hiện. 2. Service 6,7: Cuộn màn hình Active lên, xuống (Scroll Active Page Up or Down) AH:= 6: Scroll Up := 7: Scroll Down AL:= Number of lines to scroll (blank line will be inserted) (AL:= 0 means blank the whole active Window.) (CH,CL):= Row,Column of upper left corner of scroll window (DH,DL):= Row,Column of lower right corner of scroll window BH:= Attribute to be used on blank line lưu ý - Ta có thể cuộn một phần tuỳ ý của màn hình độc lập so với phần còn lại - Dòng Blank sẽ được chèn vào Window và đó là nơi sẽ tiếp nhận input - Bằng cách đặt thuộc tính cho dòng Blank, ta chọn được màu cho nó. Thuộc tính của ký tự hiển thị trên màn hình Mỗi ký tự hiển thị trên màn hình có 1 byte mô tả thuộc tính của nó, nghĩa là mô tả nó sẽ được hiển thị trên màn hình như thế nào. ý nghĩa như sau: 7 6 5 4 3 2 1 0 Blink Red Green Blue Intens. Red Green Blue Background Color Foreground Color ( màu nền ) ( màu chữ ) Bit nào được SET = 1 thì thuộc tính tương ứng với bit đó là ON, chúng ta có thể trộn các màu với nhau bằng cách cộng giá trị các bit lại. - khi đặt thuộc tính cho một dòng mới, mỗi vị trí (ký tự) trên dòng đó được đặt cùng một thuộc tính dù còn chưa có ký tự nào trên dòng đó. Các ký tự được đưa vào dòng này sẽ nhận thuộc tính đã được đặt sẵn của dòng, tất nhiên ta có thể đặt thuộc tính (tuỳ ý) cho từng ký tự khi in chúng ra nếu ta muốn. - Thí dụ ký tự màu đỏ (Foreground) trên nền Xanh lá cây (Background) có byte thuộc tính như sau: 0 0 1 0 0 1 0 0 B = 24H - ở màn hình Monochrome ta không thể sử dụng từng màu riêng rẽ được, nhưng chúng ta có thể sử dụng các thuộc tính sau: + 7: normal attrib. + 0FH: high intensity + 87H: blinking normal + F0H: blinking reverse video + 01: underline, thuộc tính này các màn hình đồ hoạ không có + 09: intense underline, thuộc tính này các màn hình đồ hoạ không có Bộ đệm màn hình và các byte thuộc tính Trong TEXT MODE Mỗi ký tự hiển thị trên màn hình ứng với 2 byte trong bộ đệm màn hình, một byte là mã ASCII và một là byte thuộc tính. Byte mã ASCII đứng trước byte thuộc tính và chúng xếp xen kẽ như vậy trong bộ nhớ đệm màn hình. Ký tự đầu tiên trong bộ đệm ứng với góc trên bên trái màn hình. - Trong màn hình MDA, bộ đệm màn hình bắt đầu ở B000:0000 - Trong màn hình đồ hoạ, ở CGA Mode, bộ đệm màn hình bắt đầu ở B800:0000 - Trong màn hình EGA, VGA bộ đệm màn hình bắt đầu ở A000:0000 lưu ý: Trừ khi chúng ta đặt lại Video Mode, cả EGA lẫn VGA đều chạy ở Mode CGA, vì vậy bộ đệm màn hình bắt đầu ở B800:0000 Chỉ trong các Mode EGA hoặc VGA, bộ đệm màn hình bắt đầu ở A000:0000 Trong GRAPHICS MODE Mọi điều cũng tương tự như trong TEXT MODE, nhưng không phải là ký tự mà là với các PIXEL (Picture Elements). Thí dụ trong MODE CGA 320 x 200 có 320x200 = 64000 Pixels, trong MODE này CGA cho phép hiển thị 4 màu, vì thế mỗi Pixel cần 2 bit trong bộ nhớ, như vậy bộ nhớ mà CGA cần là: 64000 Pixels x 2 bit/Pixel / 8 bits/Byte = 16000 bytes, xấp xỉ 16 KB Ta có thể dùng DEBUG, lệnh E để thử viết vào bộ nhớ đệm màn hình, đồng thời cũng thấy được thuộc tính ngầm định của các byte trong bộ nhớ đó (7). 3. Service 9: Viết ký tự với thuộc tính của nó tại vị trí CURSOR (Write Attribute/Character at Cursor Position) - không di chuyển con trỏ sang phải trên màn hình sau khi viết ký tự ra. - Coi các ký tự điều khiển CR (Carriage Return: 0DH) và LF (Line Feed: 0AH) như các ký tự để in ra. AH:= 9 AL:= ASCII CODE of character to write BH:= Page Number (Usully = 0) BL:= Character's attribute CX:= Number of times to write character (restricted to 1 line on screen) Chương trình minh hoạ: CHECKER.ASM CODE SEGMENT ASSUME CS: CODE, DS:CODE ORG 100h entry: mov cx,255;Loop over all 255 combinations mov al,0;Start printing with character 0 mov bl,0;and with initial attrib. = 0 mov dl,0;DL:= COLUMN, start at column 0 mov dh,4;DH:= ROW, start at row 4 color_loop: push ax mov ah,2;Service 2 Set cursor position int 10h pop ax mov ah,9;Print character in AL with ;it's attrib. in BL push ax push cx mov cx,1;write 1 character int 10h pop cx pop ax inc al;Select next character inc bl;and next attrib. inc dl;Set next cursor Column cmp dl,79;Check if cursor is at the end jb ok_cursor;of line mov dl,0;Then move to beginning of inc dh;next line ok_cursor: loop color_loop int 20h CODE ENDS END ENTRY 4. Service 0ah: Viết ký tự không kèm theo thuộc tính của nó tại vị trí CURSOR (Write Character alone at Current Cursor Position) - không di chuyển con trỏ sang phải trên màn hình sau khi viết ký tự ra. - Coi các ký tự điều khiển CR (Carriage Return: 0DH) và LF (Line Feed: 0AH) như các ký tự để in ra. Đặt: AH:= 0AH AL:= ASCII CODE of character to write BH:= Page Number (Usually 0) CX:= Number of times to write character (restricted to 1 line on screen) Service này cũng giống như Service 9, chỉ khác có một điều là nó không làm thay đổi thuộc tính của ký tự. Nói cách khác là: nếu ký tự viết ra đè lên 1 ký tự tại vị trí đó thì thuộc tính của ký tự mới lấy luôn thuộc tính của ký tự bị viết đè. 5. service 0eh - Teletype Write Đặt: AH:= 0EH AL:= ASCII CODE of character to write Sau đây là 2 điểm khác với Service 09 và 0Ah - In ra một ký tự tại vị trí hiện thời của con trỏ, sau đó dịch chuyển con trỏ sang phải - Coi các ký tự CR (Carriage Return) và LF (Line Feed) như các lệnh chứ không phải ký tự để in ra. II. Các dịch vụ màn hình của BIOS trong chế độ graphics Chế độ này còn có tên gọi All-Points-Addressable. Các hỗ trợ của BIOS IBM PC cho việc lập trình vẽ đồ hoạ thật là nghèo nàn, chỉ có một dịch vụ vẽ 1 điểm (Pixel). Nếu so với máy Macintosh, có Toolbox Routines (like QuickDraw) hay System Routine trong OS/2 Presentation Manager, trong đó có các chương trình con vẽ Circle, Line, Box ... thì thấy rõ hỗ trợ của BIOS IBM PC là cực tiểu. 1 INT 10H, SERVICE 0 - SET VIDEO MODE Set: AH:= 0 AL:= New Video Mode Khi chúng ta muốn làm việc trong chế độ Graphics, trước hết chúng ta phải đặt (Set) Mode ở độ phân giải mong muốn. Sau khi đã Set Graphics Mode, chúng ta sẽ ở trong Mode này cho tới khi chúng ta Set Mode khác. Như vậy việc Set Mode thường làm đầu tiên trong công việc đồ hoạ. Sau đây là các Mode của màn hình: SCREEN MODE ------------------------------------------------------------------------ Mode Display lines Number Adapters Maximum Pages (in AL) of Colors ------------------------------------------------------------------------ 0 40X25 B&W text CGA, EGA, VGA 8 1 40X25 Color text CGA, EGA, VGA 8 2 80X25 B&W text CGA, EGA, VGA 4(CGA),8(EGA,VGA) 3 80X25 Color text CGA, EGA, VGA 4(CGA),8(EGA,VGA) 4 320X200 4 CGA, EGA, VGA 1 5 320X200 B&W CGA, EGA, VGA 1 6 640X200 2 (on or off) CGA, EGA, VGA 1 7 80X25 Monochrome MDA, EGA, VGA 1(MDA),8(EGA,VGA) 8 160X200 16 PCjr 1 9 320X200 16 PCjr 1 A 640X200 1 PCjr 1 B Reserved for future use C Reserved for future use D 320X200 16 EGA, VGA 8 E 640X200 16 EGA, VGA 4 F 640X350 Monochrome EGA, VGA 2 10H 640X350 16 EGA, VGA 2 11H 640X480 2 VGA 1 12H 640X480 16 VGA 1 13H 320X200 256 VGA 1 ------------------------------------------------------------------------ - Ta thấy các Mode 0,1,2,3,7 là các Mode Text - chỉ hiển thị ký tự. - Ta có thể vẫn cứ sử dụng Text như bình thường ngay trong Graphics Mode, nhưng sẽ không có con trỏ. - Các mode 0..6 được sử dụng trên CGA (tất nhiên cả trên EGA, VGA vì chúng có các khả năng hiển thị bao trùm các khả năng của CGA -tính tương thích). - Các mode 8..0A: của PCjr - Các mode 0DH..10H là của EGA, VGA (ở đây VGA chạy trong mode của EGA) - Các mode 11H..13H là của chỉ có ở VGA (mode 13H là Mode 256 màu) 2 INT 10H, SERVICE 0BH - SET CGA Color Palette (Colors in CGA 320x200 mode) Set: AH:= OBH BH:= Palette Color ID (0 or 1, see below) BL:= Color(s) to set with that Palette Color ID (see below) BH:= 0 BL:= Background color (0..31), from now on, this will be color value 0 to be used in Write and Read dot. What colors 0..15 actually mean (blue,red,etc.) is discussed below. In Text mode, this background color will determine the screen border color (0..31; 16..31 means high intensity.) BH:= 1 BL: = 0: Selects Green/Red/Yellow Palette. Color value 1 in Write and Read Dot will be Green, color value 2 will be Red, color value 3 will be Yellow. BL: = 1: Select this Palette and Color values: Cyan (color value will be 1)/Magenta(2)/White(3). - Khi EGA, VGA được SET trong MODE này (320x200), chúng có thể thể hiện nhiều màu hơn. 2.1 palette ?????????? Trong Mode độ phân giải trung bình của CGA (320x200), ta có thể hiển thị cùng một lúc 4 màu trên màn hình, tại bất kỳ Pixel nào. Ta có thể chọn tuỳ ý 1 trong 4 màu, với 3 màu còn lại (màu 1,2,3) ta chỉ có thể chọn được từ 1 trong 2 bảng màu (Palette). Palette 1: Green, Red, Yellow Palette 2: Cyan , Magenta, White 2.2 Màu nền của CGA (The CGA Background Color) Các màu 1..3 có thể chọn từ bảng màu (Palette), còn màu 0 là màu nền thì chúng ta có thể chọn trong số 16 màu. Để chọn màu nền, ta sử dụng service 0BH mô tả như trên, với các tham số cụ thể như sau: AH:= 0BH BH:= 0 To inform this service that you want to select the CGA background color BL:= (0..31), đó là 16 màu và 16 màu tương ứng với độ sáng tăng cường 0: Black (off) 8: Black 1: Blue 9: Light Blue 2: Green 10: Light Green 3: Cyan 11: Light Cyan 4: Red 12: Light Red 5: Magenta 13: Light Magenta 6: Brown 14: Yellow 7: White 15: Light White Đây cũng là 16 màu ngầm định đầu tiên của EGA và VGA 2.3 Mode độ phân giải cao của CGA (Mode 6: 640x200) Do hạn chế về dung lượng bộ nhớ, CGA chỉ có thể dành 1 bit cho 1 Pixel, như vậy mỗi Pixel chỉ có 2 'màu' là màu 0 và 1 ứng với 2 giá trị của 1 bít. Độ phân giải 640x200 tương ứng với 128 000 Pixel trên màn hình và tương ứng với 128000/8 = 16000 byte trong bộ nhớ hiển thị. 3 INT 10H, SERVICE 0CH - Vẽ 1 điểm ảnh (Write pixel) Set: AH:= 0CH DX:= Row Number (0..199, 0..349, 0..479) CX:= Column Number (0..319, 0..639) AL:= Color Value BH:= Page Number (0 based) for multi-paged graphics modes ở đây AX được hiểu khác nhau trong các tiêu chuẩn khác nhau CGA, EGA, VGA. - CGA: ở độ phân giải 320x200, màu:= 0..3 ở độ phân giải 640x200, màu:= 0, 1 - EGA: màu:= 0..15 - VGA: riêng ở mode 13H, màu:= 0..255 ở các mode khác màu:= 0..15 4. Chương trình minh hoạ BOX.ASM 4.1 Chương trình vẽ một hình chữ nhật lên màn hình trong mode graphics CGA, sau đó không trả lại Mode màn hình ngầm định. Code segment Assume cs:code, ds:code org 100h start: jmp box toprow dw 50 topcol dw 100 botrow dw 100 botcol dw 200 color db 15 box proc mov ah,0 mov al,6; choose CGA Mode int 10h mov cx,botcol sub cx,topcol mov si,toprow mov di,topcol toploop: call writedot inc di loop toploop mov cx,botrow sub cx,toprow mov si,toprow sideloop: mov di,topcol call writedot mov di,botcol call writedot inc si loop sideloop mov cx,botcol sub cx,topcol mov si,botrow mov di,topcol botloop: call writedot inc di loop botloop int 20h box endp writedot proc push ax push cx push dx mov dx,si mov cx,di mov al,color mov ah,0ch int 10h pop dx pop cx pop ax ret writedot endp Code Ends end start 4.2 Chương trình vẽ một hình chữ nhật lên màn hình trong mode graphics VGA, sau đó trả lại (Reset) Mode màn hình ngầm định. Code Segment Assume CS:Code, DS:Code org 100h Start: jmp box toprow dw 0 topcol dw 0 botrow dw 479 botcol dw 639 color db 4 Box proc mov ah,0 mov al,12h; choose VGA Mode int 10h mov cx,botcol sub cx,topcol mov si,toprow mov di,topcol Toploop: call writedot inc di loop toploop mov cx,botrow sub cx,toprow mov si,toprow Sideloop: mov di,topcol call writedot mov di,botcol call writedot inc si loop sideloop mov cx,botcol sub cx,topcol mov si,botrow mov di,topcol Botloop: call writedot inc di loop botloop mov ah, 1;wait for a strike then turn to int 21h;text mode 2 = B&W text mov ah, 0 mov al, 2 int 10h;reset video adapter to default text mode int 20h Box endp Writedot proc push ax push cx push dx mov dx,si mov cx,di mov al,color mov ah,0ch int 10h pop dx pop cx pop ax ret Writedot endp Code Ends End start 5. EGA, Service 10H - Set Individual EGA Palette Register (Set 1 of 16 colors for 16-color mode) Set: AH:= 10H AL:= 0 BL:= EGA Palette Register to set (0..15) BH:= rgbRGB value to set it to (0..63) Với mỗi pixel, EGA có thể điều khiển 2 mức cường độ sáng của từng màu cơ bản: Red, Green, Blue. Mỗi màu cơ bản có 1 bit biểu diễn mức cường độ sáng thấp là r, g, b và 1 bit biểu diễn mức cường độ sáng trung bình là R, G, B, khi cả 2 bit cùng bằng 1 thì ứng với mức sáng cao (High Intensity) (r+R). Như vậy với mỗi màu cơ bản có 4 mức độ sáng là: 0=ff, r=low, R=medium và r+R= high. EGA sử dụng 6 bit để mô tả trạng thái màu của 1 pixel rgbRGB, với 6 bit có thể tổ hợp được 0..63 màu khác nhau. Do cấu tạo phần cứng của EGA, tại mỗi thời điểm chỉ có thể chọn để hiển thị 16 màu trong số 64 màu có thể, mỗi tập 16 màu đó gọi là 1 bảng màu (Palette), như vậy có 16 Palette hay còn gọi 16 Mode của EGA. Dưới đây là Mode (Palette) ngầm định của EGA Color Value Color rgbRGB --------------------------------------------------------------------------- 0 Black 0 0 0 0 0 0 1 Blue 0 0 0 0 0 1 2 Green 0 0 0 0 1 0 3 Cyan 0 0 0 0 1 1 4 Red 0 0 0 1 0 0 5 Magenta 0 0 0 1 0 1 6 Brown 0 1 0 1 0 0 7 White 0 0 0 1 1 1 8 Dark Gray 1 1 1 0 0 0 9 Light Blue 1 1 1 0 0 1 10 Light Green 1 1 1 0 1 0 11 Light Cyan 1 1 1 0 1 1 12 Light Red 1 1 1 1 0 0 13 Light Magenta 1 1 1 1 0 1 14 Yellow 1 1 1 1 1 0 15 Intense White 1 1 1 1 1 1 --------------------------------------------------------------------------- 6. VGA, Service 10H, function 10H (subfunction or subservice) set DAC Register (set 1 of 256 VGA colors) Set: AH:= 10H AL:= 10H BX:= Register to set (0..255) CH:= Green Intensity CL:= Blue Intensity DH:= Red Intensity Màn hình VGA khác các loại màn hình mà chúng ta xét đến trước đây ở chỗ nó là màn hình Analog, nghĩa là xét bên trong của VGA nó là bộ biến đổi DAC (Digital to Analog Converter). DAC này có 256 thanh ghi, chúng có thể làm việc như là các thanh ghi Palette như ở EGA ... (ở EGA các thanh ghi này là 16 bit), nhưng ở VGA các thanh ghi này là 18 bit, vì vậy giá trị của nó là miền 0..256K, nói cách khác nếu ta dùng thanh ghi của DAC để đặt màu thì ta có thể chọn được tới 256K màu để hiển thị. 18 bits DAC register: r r r r r r g g g g g g b b b b b b III. viết ảnh đồ hoạ trực tiếp vào bộ nhớ (Writing Graphics Images Directly in Memory) Hầu hết các chương trình chuyên xử lý đồ hoạ không sử dụng thủ tục Write Dot của BIOS bởi vì tốc độ thực hiện chậm mà viết trực tiếp vào bộ nhớ bằng việc sử dụng các lệnh MOV để vận chuyển nhanh số liệu giữa Conventional Memory và Display hoặc giữ Display Memory và Display Memory, thường việc này nâng cao tốc độ vẽ lên nhiều lần. Bình thường thì bộ nhớ hiển thị liên hệ với MPU qua BUS dữ liệu 8 bit (ở các CARD màn hình cắm vào khe cắm mở rộng), ở các máy mà VGA CARD là ON_BOARD thì BUS dữ liệu là 16 bit. Các CARD EGA/VGA CPU có thể thực hiện 1 lệnh để khởi tạo DATA BUS 32 bit bên trong nó. Tuy nhiên thủ tục viết vào bộ nhớ (hiển thị) phụ thuộc vào loại CARD điều khiển màn hình. Chính vì vậy mà người ta vẫn khuyên sử dụng BIOS Write Dot vì nó làm cho người lập trình không bị phụ thuộc vào loại CARD màn hình cụ thể, chính thủ tục đó đã được thiết kế để giao tiếp với phần cứng. Bộ nhớ hiển thị được tổ chức bằng hai cách: - sử dụng Packed Format - hoặc Bit-Plane Format - Bit-Plane: Đây là một kỹ thuật phân đoạn bộ nhớ thành các Bit-Plane. Một Bit-plane chứa 1 bit cho mỗi Pixel. Số lượng Bit-Plane bằng số bit cực đại dành cho mỗi Pixel bởi vì mỗi Pixel cần một số bit mô tả và mỗi một trong số các bit đó lại nằm trong 1 plane khác nhau. - Packed Display Format Trong Mode này chỉ có 1 Plane trong bộ nhớ và plane này được chia làm các phần tử (element), mỗi phần tử chứa số bit ứng với 1 pixel. Nếu mỗi pixel chỉ dùng 1 bit thì cả 2 kỹ thuật nêu trên là giống hệt nhau (identical). pixel pixel pixel pixel n n+1 n n+1 Bit plane 0 Height Bit plane 1 Height Bit plane 2 Bit plane 3 Width Width #bits/pixels a) Bit-Plane b) Packed Display Format 1. Bộ đệm màn hình CGA trong Graphics Mode (The CGA screen buffer in Graphics Mode) 1.1 Trong High Resolution Mode (640x200 pixel) Với mỗi Pixel chúng ta chỉ có thể chọn on hoặc off, trong trường hợp này PC chỉ cần sử dụng 1 bit trong bộ nhớ (VIDEO RAM) cho 1 pixel trên màn hình, như vậy cần 640x200=128000 bit = 16000 byte, xấp xỉ 16KB. Ta có thể suy luận một cách rất tự nhiên là để bật (turn on) 1 pixel tại vị trí (0,0) trên màn hình thì cần đặt (set) bit đầu tiên của bộ nhớ đệm màn hình =1. Trong thực tế đúng là như vậy. Để 'bật' pixel bên cạnh (cùng hàng), ta đặt bit tiếp theo =1 .v.v... cho đến bit thứ 640 ứng với cuối dòng 1. Còn nếu ta muốn 'bật' tiếp các pixel của hàng dưới thì vấn đề lại không hoàn toàn "tự nhiên" như vậy nữa, lý do là như sau: CGA Buffer Memory Block IBM chia graphics video buffer thành 2 khối, mỗi khối 8KB: - khối thứ nhất bắt đầu ở B800:0000 chứa thông tin ứng với các dòng chẵn của màn hình - khối thứ hai bắt đầu ở B800:2000 chứa thông tin ứng với các dòng lẻ của màn hình IBM làm như vậy vì ở CGA, CRTC thực hiện quét xen kẽ, tổ chức như vậy CRTC hoạt động thuận lợi hơn, còn với người lập trình thì quả thật là "phiền toái" hơn. Hình ảnh đồ hoạ sẽ bị chia cắt làm 2 nửa đặt trong 2 block trong bộ nhớ. 1.2 Trong Medium Resolution Mode (320x200 pixel) Vấn đề cũng khá giống trong Hires (640x200), nhưng khác ở chỗ mỗi điểm ảnh có thể nhận 1 trong 4 màu - cần 2 bit. Như vậy trong bộ nhớ mỗi nhóm 2 bit mô tả trạng thái 1 pi

Các file đính kèm theo tài liệu này:

  • docAssermbler.doc
Tài liệu liên quan