Tài liệu Khóa luận Nghiên cứu về mức bao phủ của kiểm thử: 1
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Vương Thị Quỳnh Dương
NGHIÊN CỨU VỀ MỨC BAO PHỦ CỦA KIỂM THỬ
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành : Công Nghệ Thông Tin
HÀ NỘI - 2009
2
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Vương Thị Quỳnh Dương
NGHIÊN CỨU VỀ MỨC BAO PHỦ CỦA KIỂM THỬ
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công Nghệ Thông Tin
Cán bộ hướng dẫn : TS. Trương Ninh Thuận
Cán bộ đồng hướng dẫn: ThS. Tô Văn Khánh
HÀ NỘI - 2009
3
LỜI CẢM ƠN
Bản thân em đạt được thành quả như ngày hôm nay là nhờ một phần không nhỏ
công lao dìu dắt của các thầy cô trong khoa Công Nghệ Thông Tin - Đại Học Công
Nghệ - Đại Học Quốc Gia Hà Nội. Em xin ghi nhận công lao của các thầy cô và em xin
gửi lời cảm ơn sâu sắc tới thầy cô.
Để hoàn thành được khoá luận này em xin gửi lời cảm ơn chân thành tới TS.
Trương Ninh Thuận và ThS. Tô Văn Khánh, hai thầy đã hướng dẫn, giúp đỡ, chỉ bảo rất
tận tình cho em.
...
59 trang |
Chia sẻ: haohao | Lượt xem: 1190 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Khóa luận Nghiên cứu về mức bao phủ của kiểm thử, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
1
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Vương Thị Quỳnh Dương
NGHIÊN CỨU VỀ MỨC BAO PHỦ CỦA KIỂM THỬ
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành : Công Nghệ Thông Tin
HÀ NỘI - 2009
2
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Vương Thị Quỳnh Dương
NGHIÊN CỨU VỀ MỨC BAO PHỦ CỦA KIỂM THỬ
KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công Nghệ Thông Tin
Cán bộ hướng dẫn : TS. Trương Ninh Thuận
Cán bộ đồng hướng dẫn: ThS. Tô Văn Khánh
HÀ NỘI - 2009
3
LỜI CẢM ƠN
Bản thân em đạt được thành quả như ngày hôm nay là nhờ một phần không nhỏ
công lao dìu dắt của các thầy cô trong khoa Công Nghệ Thông Tin - Đại Học Công
Nghệ - Đại Học Quốc Gia Hà Nội. Em xin ghi nhận công lao của các thầy cô và em xin
gửi lời cảm ơn sâu sắc tới thầy cô.
Để hoàn thành được khoá luận này em xin gửi lời cảm ơn chân thành tới TS.
Trương Ninh Thuận và ThS. Tô Văn Khánh, hai thầy đã hướng dẫn, giúp đỡ, chỉ bảo rất
tận tình cho em.
Dù đã cố gắng rất nhiều trong quá trình làm khoá luận, nhưng cũng không thể
tránh khỏi những thiếu sót, em rất mong nhận được sự góp ý của các thầy, cô giáo để
em có thể hoàn thiện hơn.
Hà nội, ngày 23 tháng 5 năm 2009
Sinh viên: Vương Thị Quỳnh Dương
4
TÓM TẮT KHOÁ LUẬN
Trong thời đại công nghệ thông tin bùng nổ như hiện nay, phần mềm đóng một
vai trò cực kỳ quan trọng trong hầu hết các lĩnh vực của đời sống. Phần mềm là một sản
phẩm cần phải được đảm bảo về chất lượng. Đảm bảo chất lượng phần mềm (SQA-
Software Quality Assuarance) là một nhiệm vụ đặc biệt quan trọng trong phát triển
phần mềm và là vấn đề sống còn đối với tất cả các công ty phần mềm. Để đảm bảo chất
lượng phần mềm thì trong các dự án phần mềm phải tiến hành xác minh và thẩm định.
Một trong các hoạt động xác minh và thẩm định quan trọng là tiến hành kiểm thử phần
mềm. Kiểm thử cần được tiến hành ở nhiều mức và phối hợp nhiều kỹ thuật khác nhau.
Phần không thể thiếu trong kiểm thử là việc xây dựng các ca kiểm thử. Các ca kiểm thử
phải đủ tốt mới có thể phát hiện ra khiếm khuyết của phần mềm. Một vấn đề đặt ra ở
đây là làm thế nào để xác định được ca kiểm thử đó là tốt, những tiêu chí nào đánh giá
chất lượng của chính ca kiểm thử? Và công việc tiến hành kiểm tra khi nào thì dừng lại?
Nội dung của khoá luận sẽ đề cập đến hai phương pháp nhằm mục đích xây dựng
các ca kiểm thử tốt đó là kỹ thuật phân tích bao phủ code và kỹ thuật phân tích giá trị
điểm biên. Phân tích bao phủ code sẽ phải tiến hành xây dựng các ca kiểm thử tất cả các
luồng đường đi có thể qua chương trình, các luồng đường đi từ input tới output được
xác định dựa trên các nhánh rẽ của chương trình. Thông thường các lỗi về lập trình
thường hay xảy ra tại giá trị biên do vậy tại giá trị biên cần phải thiết kế ca kiểm thử
kiểm tra nó. Trong phạm vi của khoá luận chúng tôi sẽ tiến hành cài đặt một chương
trình nhằm tìm ra các câu lệnh điều khiển của file nguồn java và chỉ ra giá trị biên trong
các biểu thức so sánh nhằm mục đích chỉ ra để xuất các giá trị biên baseline và robust
cần được kiểm tra.
5
Mục lục
CHƯƠNG 1. MỞ ĐẦU...............................................................................................10
1.1 Bối cảnh nghiên cứu ..........................................................................................10
1.2 Nội dung bài toán ..............................................................................................11
1.3 Cấu trúc của khoá luận.......................................................................................12
CHƯƠNG 2. GIỚI THIỆU VỀ BAO PHỦ CODE ......................................................14
2.1 Bao phủ code là gì ?...........................................................................................14
2.2 Tại sao cần đo lượng code được bao phủ ?.........................................................14
2.3 Làm thế nào để xác định lượng code được bao phủ ? .........................................15
2.4. Trong tiến trình test thì bao phủ code hợp với kỹ thuật kiểm thử nào ? ............15
2.4.1 Kiểm thử hộp đen .......................................................................................15
2.4.2 Kiểm thử hộp trắng .....................................................................................15
2.4.3 Bao phủ code ..............................................................................................16
CHƯƠNG 3. GIỚI THIỆU MỘT SỐ PHƯƠNG PHÁP BAO PHỦ ............................17
3.1 Bao phủ câu lệnh (Statement coverage) .............................................................17
3.2 Bao phủ nhánh (Branch coverage) .....................................................................17
3.3 Bao phủ đường đi (path coverage) .....................................................................18
3.4 Bao phủ điều kiện (condition coverage) .............................................................18
3.5 Bao phủ nhiều điều kiện (multiple condition coverage) .....................................18
CHƯƠNG 4. PHÂN TÍCH, ĐÁNH GIÁ CÁC PHƯƠNG PHÁP BAO PHỦ ..............19
4.1 Phân tích phương pháp bao phủ câu lệnh (statement coverage) ..........................19
4.2 Phân tích phương pháp bao phủ nhánh (branch coverage)..................................23
4.3 Phân tích phương pháp bao phủ đường đi (path coverage) .................................28
CHƯƠNG 5. PHÂN TÍCH GIÁ TRỊ ĐIỂM BIÊN......................................................33
5.1 Giới thiệu...........................................................................................................33
5.2 Phân hoạch tương đương(equivalence partitioning) ...........................................33
5.3 Phân tích giá trị biên (boundary value analysis) .................................................34
5.3.1 Tổng quan về phân tích giá trị điểm biên.....................................................34
5.3.2 Lựa chọn các ca kiểm thử sử dụng phân tích giá trị điểm biên.....................34
5.3.3 Phân tích giá trị biên đơn biến (Single-Variable BVA)................................35
5.3.4 Phân tích giá trị biên đa biến (Multi – Variable BVA).................................36
5.3.5 Kết luận ......................................................................................................40
CHƯƠNG 6. THỰC NGHIỆM ...................................................................................41
6.1 Ví dụ một chương trình đơn giản .......................................................................41
6.1.1 Xây dựng các ca kiểm thử cho chương trình trên ........................................42
6.1.2 Kết luận ......................................................................................................46
6.2 Chương trình cài đặt tìm kiếm các câu lệnh rẽ nhánh trong mã nguồn java. .......46
6.2.1 Giới thiệu về chương trình ..........................................................................46
6.2.2 Mô tả các chức năng chính..........................................................................46
6.2.3 Biểu đồ trình tự ...........................................................................................47
6.2.4 Thuật toán đã sử dụng .................................................................................49
6.2.5 Các lớp cài đặt ............................................................................................51
6.2.5 Kết quả thao tác các chức năng giữa người dùng và chương trình như sau ..51
6.3 Kết luận .............................................................................................................56
6
CHƯƠNG 7: KẾT LUẬN KHOÁ LUẬN ...................................................................57
7.1 Kết luận về khoá luận ........................................................................................57
7.2 Hướng nghiên cứu phát triển trong tương lai......................................................57
TÀI LIỆU THAM KHẢO ...........................................................................................59
7
DANH SÁCH CÁC HÌNH VẼ
Hình 1 : Kết quả kiểm tra mã nguồn được thực thi ......................................................20
Hình 2 : Kết quả đo bao phủ dòng lệnh........................................................................23
Hình 3 : Kết quả thực hiện test case 1..........................................................................26
Hình 4 : Kết quả đo bao phủ nhánh khi thực hiện test case 1 .......................................26
Hình 5 : Kết quả khi thực hiện test case 2 ....................................................................27
Hình 6 : Kết quả đo bao phủ nhánh khi thực hiện test case 2 ......................................27
Hình 7: Kết quả thực hiện test case 3...........................................................................30
Hình 8 : Kết quả đo bao phủ khi thực hiện test case 3..................................................31
Hình 9 : Kết quả thực hiện test case 4..........................................................................32
Hình 10 : Kết quả đo bao phủ khi thực hiện test case 4................................................32
Hình 11 : Tập hợp các giá trị biên baseline cho đơn biến trên một khoảng đầu vào .....35
Hình 12 : Đường các giá trị baseline và robust cho đơn biến trên một khoảng đầu vào 36
Hình 13 : Tập hợp các giá trị baseline và rubust trường hợp đơn biến trên hai khoảng
đầu vào........................................................................................................................36
Hình 14 : Tập giá trị baseline và robust của biến N trong trường hợp hai biến đầu vào
....................................................................................................................................37
Hình 15 : Tập hợp giá trị baseline và rubust trên hai khoảng của biến M trong
trường hợp hai biến đầu vào 38
Hình 16 : Tổng hợp tất cả các giá trị của hai biến N và M trên hai khoảng đầu vào .....38
Hình 17 : Tổng hợp toán bộ giá trị baseline, robust trường hợp đa biến đầu vào trên hai
khoảng.........................................................................................................................39
Hình 18 : Ví dụ cấu trúc một chương trình đơn giản ....................................................41
Hình 19 : Các công việc cần thực hiện (tô đậm)..........................................................42
Hình 20 : Test case 1 kiểm tra công việc A..................................................................42
Hình 21 : Test case 2 kiểm tra công việc B ..................................................................42
Hình 22 : Test case 3 kiểm tra công việc C ..................................................................43
Hình 23 : Hai điều kiện một và hai là độc lập nhau......................................................43
Hình 24 : Kiểm tra đồng thời công việc A và công việc C trong cùng 1 test case.........44
Test case 2 kiểm tra công việc B và công việc C: ........................................................44
Hình 25 : Test case kiểm tra đồng thời công việc B và C.............................................44
Hình 26 : Nhánh không được bao phủ .........................................................................45
Hình 27. Biểu đồ trình tự.............................................................................................47
Hình 28: Biều đồ trình tự khi tương tác câu lệnh if ......................................................48
Hình 29: Biều đồ trình tự khi tương tác câu lệnh while................................................48
Hình 30: Biểu đồ trình tự khi tương tác câu lệnh for ....................................................49
Hình 31: Kiến trúc lớp cài đặt Get_File_Name ............................................................51
Hình 32: Kiến trúc lớp ReadContentFile......................................................................51
Hình 33: Giao diện yêu cầu nhập tên file cần đọc ........................................................52
Hình 34: Nhập tên file không đúng định dạng *.java ...................................................52
Hình 35: Nhập vào một tên file đúng để đọc................................................................52
Hình 36 : Nội dung của file TestFile.java ....................................................................52
Hình 37: Kết quả tìm kiếm câu lệnh điều khiển ...........................................................53
Hình 38 : Nội dung của file chứa câu lệnh điều khiển được tìm kiếm ..........................53
8
Hình 39 : Kết quả khi người dùng muốn thao tác với câu lệnh if .................................54
Hình 40 : Kết quả khi người dùng muốn thao tác với câu lệnh while ...........................55
Hình 41 : Kết quả khi người dùng muốn thao tác với câu lệnh for ...............................55
9
DANH MỤC CÁC THUẬT NGỮ
Thuật ngữ Khái niệm
Statement coverage Bao phủ câu lệnh
Branch coverage Bao phủ nhánh
Path coverage Bao phủ đường đi
Condition coverage Bao phủ điều kiện
Boundary value analysis(BVA) Phân tích giá trị biên
Single-variable BVA Phân tích giá trị biên đơn biến
Multi-variable BVA Phân tích giá trị biên đa biến
Equivalence partitioning Phân hoạch tương đương
Test case Ca kiểm thử
Valication Xác minh
Verification Thẩm định
Test entropy Kiểm tra độ bất định trong cấu trúc của
hệ thống
Cyclomatic complextity Số đường độc lập tuyến tính đi qua mã
nguồn
Baseline đường cơ sở
Robust mạnh mẽ
Module Mô đun
10
CHƯƠNG 1. MỞ ĐẦU
1.1 Bối cảnh nghiên cứu
Trong thời đại công nghệ thông tin bùng nổ như ngày nay, phần mềm đóng vai
trò vô cùng quan trọng ở hầu hết các lĩnh vực của cuộc sống. Đặc biệt trong khối ngành
doanh nghiệp, dịch vụ, quảng cáo, nó đã trợ giúp đắc lực nhằm làm tăng chất lượng
nghiệp vụ. Mỗi bộ phận đều phụ thuộc vào phần mềm để hỗ trợ cho việc phát triển, sản
xuất, quảng cáo nhằm tiếp thị các sản phầm và dịch vụ của họ.
Phần mềm cũng được xem là một sản phẩm, nhưng là loại hình sản xuất đặc biệt.
Trong một quy trình sản xuất phần mềm, giai đoạn phát hiện, xác định và sửa các lỗi
phần mềm được xem là phần không thể thiếu nhằm đảm bảo chất lượng phần mềm.
Đảm bảo chất lượng phần mềm là một nhiệm vụ đặc biệt quan trọng trong phát triển
phầm mềm và là vấn đề sống còn đối với tất cả các công ty phần mềm. Ở mức cao, việc
đảm bảo chất lượng liên quan đến một loạt các vấn đề như chuẩn và qui trình quản lý
của công ty, môi trường và công cụ phát triển, mô hình phát triển phần mềm được lựa
chọn, kỹ năng của nhân viên…Ở mức thấp hơn, chất lượng phần mềm được đảm bảo
trên cơ sở hiểu đúng yêu cầu của khách hàng, đặc tả đúng yêu cầu, tạo ra các thiết kết
tốt và chuyển tải nó một cách đúng đắn thành mã nguồn của phần mềm. Chi phí bỏ ra
cho giai đoạn này thường chiếm không nhỏ trong tổng chi phí mà các tổ chức phát triển
phần mềm bỏ ra cho toàn bộ qui trình. Với tốc độ phát triển chóng mặt của lĩnh vực
công nghệ thông tin trên cả hệ thống phần cứng và phần mềm, khả năng xảy ra nhiều
lỗi, đặc biệt là những lỗi phức tạp là rất cao. Lỗi có thể gây thiệt hại to lớn cả về tiền
bạc, thời gian và công sức con người. Chính vì vậy, cần có phương pháp phát hiện ra lỗi
sớm nhằm giảm công sức để sửa chúng. Để phát hiện ra những lỗi phần mềm, phần
mềm cần phải được thẩm định (Valication) và kiểm chứng (Verification). Xác minh,
thẩm định giúp ta phát hiện và sửa lỗi phần mềm từ đó đánh tính dùng được của phần
mềm.
Con người không thể không mắc sai lầm, và phần mềm mà không được kiểm tra
sẽ làm việc không hiểu quả. Thông thường, có từ 20 đến 50 lỗi trên 1000 dòng lệnh
được tìm thấy trong suốt quá trình phát triển, và vẫn còn từ 1.5 đến 4 lỗi trên 1000 dòng
lệnh sau khi kiểm thử hệ thống [1]. Mỗi lỗi này đều có thể dẫn tới lỗi tổng thể hay
không đúng với đặc tả yêu cầu. Mục đích của kiểm thử phần mềm là làm giảm lỗi phần
mềm xuống mức có thể chấp nhận được, tuỳ thuộc vào mức độ phức tạp của dự án.
Chính vì vậy, kiểm thử phần mềm có vai trò vô cùng quan trọng trong toàn bộ quy trình
11
phát triền phần mềm, và trong công nghiệp phần mềm hiện nay, nó đang thu hút sự
quan tâm của nhiều nhà nghiên cứu.
Trong quy trình phát triển phần mềm hiện đại có giai đoạn kiểm thử phần mềm
dùng để kiểm tra tính đúng đắn của phần mềm. Mục tiêu chính của nhóm phát triển
phần mềm là phải làm sao tạo ra được những sản phầm phần mềm có chất lượng tốt
nhất.Việc viết tập hợp các ca kiểm thử (test cases) là một phần quan trọng không thể
thiếu trong phương pháp phát triển phần mềm linh hoạt. Tập hợp các ca kiểm thử đúng
đắn giúp chúng ta giảm thiểu tối đa các lỗi, giảm thời gian tìm kiếm lỗi, tạo ra được các
phần mềm tốt, tính ổn định cao. Một cách lý tưởng thì người kiểm tra (tester) phải kiểm
tra tất cả các giá trị của biến đầu vào, tuy nhiên điều này là không tưởng bởi vì thường
thì miền giá trị của biến đầu vào là rất lớn, thậm chí gần như dài vô hạn hoặc vô hạn.
Do đó người kiểm tra không thể kỉêm tra được tất cả mọi giá trị, mọi trường hợp mà chỉ
kiểm tra một số trường hợp đại diện mà thôi. Như vậy luôn xuất hiện câu hỏi: xây dựng
những ca kiểm thử nào là hợp lý ? Bao giờ có thể ngưng kiểm tra? Các ca kiểm thử tạo
ra liệu có tốt hay không? Giá trị được chọn để xây dựng ca kiểm thử là những giá trị
nào?... Để nhằm giải đáp các thắc mắc này và xây dựng lên các ca kiểm thử tốt, trong
tài liệu này chúng tôi sẽ phân tích một số đề xuất được đưa ra nhằm đánh giá chất lượng
của một ca kiểm thử: phân tích bao phủ code (code coverage analysis), kiểm tra các
điểm đặc biệt (particular point) cụ thể là phân tích đánh giá giá trị tại vị trí biên.
1.2 Nội dung bài toán
Kiểm thử là giai đoạn vô cùng quan trọng trong quá trình phát triển phần mềm.
Trong giai đoạn này thì công việc thiết kế các ca kiểm thử lại đóng vai trò cực kỳ quan
trọng. Nhằm giúp xây dựng các ca kiểm thử tốt, chiến lược kiểm thử tối ưu, trong tài
liệu này sẽ đề cập đến kỹ thuật phân tích code bao phủ và phân tích các giá trị biên. Kỹ
thuật phân tích bao phủ sẽ đánh giá độ bao phủ từ đó xác định quá trình kiểm tra có đạt
được độ bao phủ yêu cầu hay không, tỷ lệ yêu cầu đã được kiểm tra (tính trên các yêu
cầu của phần mềm và số lượng code đã viết). Trong phạm vi tài liệu sẽ phân tích các
cách bao phủ cơ bản nhưng chúng vô cùng mạnh mẽ. Thông thường, không thể kiểm
thử với mọi dữ liệu, chiến lược chung khi thiết kế ca kiểm thử là phân hoạch tương
đương (equivalence partitioning). Phân hoạch tương đương chia miền dữ liệu vào ra
thành các vùng, mà mỗi vùng chứa các dữ liệu có cùng hành vi. Do đó, đối với mỗi
vùng dữ liệu chỉ cần xây dựng một ca kiểm thử để đại diện. Theo kinh nghiệm, các sai
sót về lập trình thường xảy ra đối với dữ liệu biên nên cần thêm vào đó các ca kiểm thử
kiểm tra đối với biên của các vùng. Trong tài liệu này cũng sẽ tiến hành phân tích đánh
12
giá các giá trị biên sử dụng trong các ca kiểm thử. Đưa ra các giá trị biên đề xuất cần
phải được kiểm tra để đảm bảo phần mềm vẫn hoạt động tốt và ổn định trên các giá trị
đó. Luồng chương trình từ input đến output có các cách đi khác nhau chủ yếu được dựa
vào các câu lệnh điều khiển trong mã nguồn, chúng tôi sẽ tiến hành cài đặt một chương
trình tìm kiếm câu lệnh điều khiển trong file mã nguồn java và xuất ra giá trị biên trong
câu lệnh điều khiển có chứa toán tử so sánh. Tóm lại bài toán đưa ra ở đây là làm sao
xây dựng được ca kiểm thử tốt, các lỗi lập trình thường xảy ra ở các điểm biên của dải
giá trị đầu vào, vậy thì ca kiểm thử thiết kế để kiểm tra giá trị biên là gì? Giải quyết bài
toán này chúng tôi sẽ phân tích kỹ thuật bao phủ code và kỹ thuật phân tích giá trị biên,
sau cùng là cài đặt chương trình tìm kiếm câu lệnh điều khiển của mã file mã nguồn
java, xuất ra giá trị biên trong đó.
1.3 Cấu trúc của khoá luận
Phần còn lại của khoá luận được trình bày như sau:
Chương 2 giới thiệu về bao phủ code. Trong chương này sẽ giới thiệu về kỹ thuật bao
phủ code. Lý do, tầm quan trọng của bao phủ code. Cách tiếp cận để có thể đo code
được bao phủ. Phân loại bao phủ code vào kỹ thuật kiểm thử hộp trắng.
Chương 3 giới thiệu về một số phương pháp đo bao phủ code cơ bản nhưng vô cùng
mạnh mẽ đó là các phương pháp : bao phủ câu lệnh đo bao nhiêu câu lệnh được thực thi
trong tổng số câu lệnh mã nguồn, bao phủ nhánh đo bao nhiêu nhánh đã được thực thi
trong tổng số các nhánh rẽ của chương trình, bao phủ đường đi đo bao nhiêu luồng
đường đi được kiểm tra, bao phủ điều kiện tương tự như bao phủ nhánh nhưng nó có độ
nhạy tốt hơn, bao phủ nhiều điều kiện kết hợp các biểu thức điều kiện con trong các câu
lệnh rẽ nhánh.
Chương 4 phân tích, đánh giá các phương pháp bao phủ. Trong chương này sẽ tiến hành
phân tích cụ thể từng phương pháp : bao phủ câu lệnh, bao phủ nhánh, bao phủ đường
đi, đồng thời đánh giá ưu nhược điểm của từng phương pháp.
Chương 5 trình bày tổng quan về phân tích giá trị điểm biên, chiến lược phân hoạch
tương đương. Tiếp đó phân tích kỹ thuật phân tích giá trị biên đơn biến và đa biến.
Chương 6 thực nghiệm một chương trình đơn giản. Chúng tôi sẽ tiến hành phân tích bài
toán thực nghiệm, đề xuất các ca kiểm thử để đảm bảo kiểm tra code được bao phủ
chương trình. Thông thường để xây dựng các ca kiểm thử kiểm tra bao phủ các nhánh
và bao phủ đường đi ta phải xác định trong chương trình mã nguồn có bao nhiêu câu
13
lệnh rẽ nhánh, chúng tôi sẽ cài đặt một chương trình đơn giản giúp xuất ra toàn bộ câu
lệnh rẽ nhánh và giá trị biên trong các biểu thức điều kiện trong file nguồn cần kiểm tra.
File nguồn đầu vào đọc là file java.
Chương 7 kết luận về khoá luận và hướng nghiên cứu tiếp theo.
14
CHƯƠNG 2. GIỚI THIỆU VỀ BAO PHỦ CODE
2.1 Bao phủ code là gì ?
Bao phủ code là phần trăm code được phủ bằng cách kiểm tra (test) tự động. Đo
lượng code bao phủ đơn giản là xác định những câu lệnh nào được thực thi, những câu
lệnh nào không được thực thi thông qua việc kiểm tra. Nhìn chung, một hệ thống bao
phủ code sẽ thu thập thông tin về chương trình đang chạy và kết hợp với thông tin
nguồn để tạo ra báo cáo bao phủ code trên test suite [2].
Trong tiến trình phát triển thì bao phủ code là một phần của vòng lặp các thông
tin phản hồi. Khi các ca kiểm thử (test case) được thực thi, bao phủ code sẽ làm nổi bật
lên diện mạo của các dòng code không được kiểm tra thoả đáng và các dòng code này
yêu cầu cần phải được kiểm tra thêm. Quá trình kiểm tra code không được thực thi và
sau đó thêm vào các ca kiểm thử thích hợp để kiểm tra lại là một vòng lặp. Vòng lặp
này sẽ tiếp tục lặp đi lặp lại cho tới khi bao phủ đạt đến một vài chỉ tiêu đề ra.
2.2 Tại sao cần đo lượng code được bao phủ ?
Cần phải hiểu một cách đúng đắn rằng test unit giúp ta cải thiện chất lượng và
giúp ta dự đoán trước được chất lượng của phần mềm. Tuy nhiên liệu rằng ta có thể biết
được unit test nào tốt cho phần code của ta? Test bao nhiêu thì đủ? Có cần phải test
nhiều hơn? Đo độ bao phủ code sẽ tìm ra câu trả lời cho những câu hỏi này.
Việc đo code bao phủ giúp ta tránh được test entropy (kiểm tra độ bất định trong
cấu trúc của hệ thống)[3]. Khi code của ta trải qua nhiều chu trình phát hành, có thể có
khuynh hướng làm hao mòn các unit test. Khi có code mới được thêm vào thì có thể sẽ
không cần đến các test case chuẩn mà dự án đã sử dụng trong lần phát hành đầu tiên.
Đo bao phủ code có thể giữ cho các test của ta đạt đến các chuẩn mà ta mong muốn.
Code không pass toàn bộ nhưng ta có thể tự tin rằng nó đã được kiểm tra kỹ lưỡng.
Nói tóm lại, đo độ bao phủ code vì các lý do sau:
- Để biết phần kiểm của ta có thực sự kiểm tra được code.
- Để biết được kiểm tra đến khi nào là đủ.
- Để duy trì chất lượng các ca kiểm thử qua các vòng đời của dự án
Nhìn chung bao phủ code theo nguyên tắc 80 – 20. Tăng giá trị bao phủ sẽ dần
trở lên khó khăn, với việc thực hiện các kiểm tra mới sẽ càng ngày càng ít làm tăng giá
15
trị bao phủ. Nếu ta tuân theo các nguyên tắc lập trình, các điều kiện lỗi thường sẽ được
kiểm tra ở nhiều cấp độ trong phần mềm của ta, có những dòng code có thể rất khó để
đạt tới các mức kiểm tra thực tế. Đo bao phủ không phải là việc thay thế bằng code tốt
và phong cách lập trình hay.
2.3 Làm thế nào để xác định lượng code được bao phủ ?
Có nhiều phương pháp để đo độ bao phủ code. Đại thể có ba cách tiếp cận chính,
chúng có thể được kết hợp sử dụng với nhau.
Đo mã nguồn: Phương pháp này sẽ thêm các câu lệnh công cụ vào mã nguồn và
biên dịch lại mã nguồn với các công cụ biên dịch thông thường. Một điểm bất lợi của
phương pháp này là phải biên dịch hai lần do đó có thể làm chậm tiến trình, đặc biệt là
trong các dự án lớn.
Công cụ mã trung gian: các lớp biên dịch là công cụ, bằng việc thêm vào
bytecodes mới thì các lớp công cụ mới cũng được tạo ra.
Thu thập thông tin thực thi: phương pháp này thu thập thông tin từ môi trường
thực thi khi code thi hành để xác định thông tin bao phủ.
2.4. Trong tiến trình test thì bao phủ code hợp với kỹ thuật kiểm thử nào ?
2.4.1 Kiểm thử hộp đen
Kiểm thử hộp đen là sự kiểm thử sử dụng các ca kiểm thử được thiết kế dựa trên
đặc tả yêu cầu, tài liệu người dùng nhằm mục đích phát hiện ra các khiếm khuyết. Kiểm
thử hộp đen nhìn nhận mô đun (module) được kiểm tra như là một hộp đen, và chỉ quan
tâm đến chức năng (hành vi) của mô đun (module), tức là kiểm tra xem có hoạt động
đúng với đặc tả hay không. Các ca kiểm thử bao gồm các trường hợp bình thường và
không bình thường (dữ liệu không hợp lệ…) của mô đun[4].
2.4.2 Kiểm thử hộp trắng
Kiểm thử hộp trắng là sự kiểm thử dựa trên việc phân tích chương trình để xác
định các ca kiểm thử. Kỹ thuật chính ở đây là phân tích mã nguồn, xác định các luồng
điều khiển từ input đến output. Dựa trên việc xác định các đường đi người ta đưa ra các
ca kiểm thử nhằm mục đích kiểm tra tất cả các đường đi có thể. Tức là đảm bảo mọi tổ
hợp hai lệnh liên tiếp đều được thực hiện ít nhất một lần trong một ca kiểm thử nào đó.
Việc xác định các đường đi dựa trên việc phân tích các cấu trúc rẽ nhánh và các vòng
lặp[5].
16
2.4.3 Bao phủ code
Từ những đặc điểm về kỹ thuật kiểm thử hộp đen và kiểm thử hộp trắng như
trên ta có thế nói bao phủ code là một phương pháp kiểm thử hộp trắng, bao phủ code
cần phải hiểu về mã nguồn, có thể truy cập vào mã nguồn hơn là đơn giản sử dụng các
giao diện được cung cấp. Có thế nói bao phủ code là phương pháp hữu ích nhất trong
suốt giai đoạn kiểm thử mô đun (module), tuy nhiên nó cũng có những lợi ích trong
kiểm thử tích hợp và trong các lần kiểm thử khác nữa, phụ thuộc vào chúng ta kiểm tra
cái gì và kiểm tra như thế nào. Kiểm thử đệ quy thường là kiểm thử hộp đen do đó có
thể không phù hợp với bao phủ code.
17
CHƯƠNG 3. GIỚI THIỆU MỘT SỐ PHƯƠNG PHÁP BAO PHỦ
3.1 Bao phủ câu lệnh (Statement coverage)
Bao phủ câu lệnh còn được gọi là bao phủ dòng lệnh (line coverage), là một cách
đo số câu lệnh được thực thi khi ta áp dụng những ca kiểm thử thích hợp. Đối với mỗi
câu lệnh không được bao phủ, chúng ta sẽ tìm hiểu nguyên nhân tại sao nó không được
bao phủ. Những câu lệnh không được thực thi thì công cụ bao phủ sẽ dùng cờ đánh dấu,
những câu lệnh được thực thi sẽ được xuất ra thành bản báo cáo. Đo câu lệnh được bao
phủ gần như được xem là cách thực thi đơn giản nhất, nó có thể áp dụng thông qua
bytecode. Bao phủ câu lệnh thường hay được những người phát triển sử dụng bởi vì nó
dễ dàng kết hợp với các dòng mã nguồn. Để có thể tiến hành phân tích kết quả test ta
cần tính tỉ lệ phần trăm câu lệnh đã được kiểm tra. Tính được phần trăm số câu lệnh
được bao phủ cần tiến hành hai phép đo cốt yếu đó là : tổng số các câu lệnh trong mã
nguồn và số câu lệnh đã được kiểm tra bởi test suite. Công thức tính phần trăm dòng
lệnh được thực thi [6]:
Số câu lệnh được kiểm tra
Phần trăm dòng lệnh = * 100%
Tổng số câu lệnh mã nguồn
3.2 Bao phủ nhánh (Branch coverage)
Bao phủ nhánh còn được biết đến là bao phủ quyết định (Decision coverage).
Bao phủ nhánh là một phép đo dựa trên các điểm quyết định như là các điểm quyết định
trong câu lệnh rẽ nhánh if, while…Một ví dụ đơn giản về lệnh rẽ nhánh if :
if (a>b)
System.out.println( a);
else
System.out.println(b);
Báo cáo của cách bao phủ nhánh là báo ra các biểu thức boolean đã được kiểm
tra trong các cấu trúc điều khiển, đánh giá cả giá trị “true” và “false”. Chẳng hạn một
câu lệnh if(a>b) trong ví dụ trên sẽ chia chương trình thành 2 nhánh. Nếu muốn cả 2
nhánh đều được thực hiện thì cần phải có những test case để cho a > b trong câu lệnh
trên mang cả hai giá trị “true” và “false” tại hai thời điểm nào đó. Nhưng cũng có
18
trường hợp chỉ một ca kiểm thử mà a > b đã có thể mang cả hai giá trị, chẳng hạn nếu
câu lệnh này nằm trong một vòng lặp thì có thể trong một lần lặp nào đó ta có a > b
mang giá trị “true”, nhưng lần lặp sau thì a > b mang giá trị “false”.Công thức tính phần
trăm nhánh được bao phủ [6]:
Số nhánh được thực thi
Phần trăm nhánh được bao phủ = *100%
Tổng số nhánh trong chương trình
3.3 Bao phủ đường đi (path coverage)
Một đường đi thể hiện một luồng việc thực thi từ khi bắt đầu đến khi kết thúc
một chương trình, một phương thức có N quyết định sẽ có 2N cách đi, và nếu phương
thức có vòng lặp thì có thể sẽ có vô số cách đi. Bao phủ đường đi cũng là một trong số
các cách đo trong kiểm thử hộp trắng, nó sẽ kiểm tra trong từng hàm xem các đường đi
có được kiểm tra hay không. Kỹ thuật chính ở đây là phân tích mã nguồn, xác định các
luồng điều khiển hay đường đi của chương trình từ input đến output. Dựa trên việc xác
định các đường đi người ta đưa ra các ca kiểm thử nhằm kiểm tra tất cả các đường đi có
thể. Việc xác định các đường đi dựa trên việc phân tích các cấu trúc rẽ nhánh và các
vòng lặp.
3.4 Bao phủ điều kiện (condition coverage)
Bao phủ điều kiện tương tự như bao phủ nhánh nhưng nó có độ nhạy tốt hơn với
luồng điều khiển. Bao phủ điều kiện đo các biểu thức con độc lập với các biểu thức con
khác. Bao phủ điều kiện báo cáo kết luận logic “true” hoặc “false” của từng biểu thức
boolean con, các biểu thức boolean con được phân tách bằng các phép logic-and và
logic-or nếu chúng xảy ra.
3.5 Bao phủ nhiều điều kiện (multiple condition coverage)
Bao phủ nhiều điều kiện là bao phủ kết hợp đồng thời các biểu thức boolean con
xảy ra. Giống với bao phủ điều kiện (condition coverage) các biểu thức con được phân
tách bằng các phép logic-and và logic-or.
19
CHƯƠNG 4. PHÂN TÍCH, ĐÁNH GIÁ CÁC PHƯƠNG PHÁP
BAO PHỦ
Chúng ta đề xuất một số phương pháp bao phủ code nhằm đánh giá được chất
lượng của ca kiểm thử. Để nhìn nhận bên trong mỗi hàm, và xác định những câu lệnh
nào được thực thi, những câu lệnh nào không được thực thi thì yêu cầu ta cần phải phân
tích bao phủ code. Phân tích code sẽ giúp ta: làm rõ những code không được thực thi
nhờ test suite. Thêm vào các ca kiểm thử để kiểm tra lại. Nhận ra code dư thừa. Khi
chương trình thiết kế thay đổi thường sẽ dẫn đến code dư thừa. Code dư thừa nên được
loại bỏ vì nó có thể gây khó hiểu cho công việc của người bảo trì. Phân tích code bao
phủ còn được sử dụng để theo dõi các phần code đặc biệt. Với việc đếm từng dòng
code, bản phân tích bao phủ còn được sử dụng để sắp xếp có thứ tự các khối cơ bản
trong một hàm. Thông qua phân tích bao phủ code sẽ làm giảm số lỗi. Bao phủ code
không phải là phương thuốc chữa bách bệnh, bao phủ code sẽ không giúp nhận dạng
các loại điều kiện, các vần đề về sử dụng bộ nhớ, con trỏ lỗi, thẩm định kết quả chương
trình. Phân tích bao phủ code luôn sẵn có trong nhiều ngôn ngữ lập trình phổ biến như
C++, nhưng chúng thường là các sản phẩm thứ ba được tích hợp với bộ biên dịch, và
thường rất đắt. Như vậy phân tích bao phủ code là quá trình tạo ra các ca kiểm thử để
tìm ra các vùng chưa được thực thi, tạo thêm các ca kiểm thử để tăng bao phủ và xác
định lượng code bao phủ sẽ gián tiếp đo chất lượng code. Dưới đây ta sẽ lần lượt phân
tích một số đề xuất bao phủ nhằm đưa ra để đánh giá chất lượng của ca kiểm thử: bao
phủ câu lệnh (statement coverage), bao phủ nhánh (branch coverage) và bao phủ đường
đi (path coverage) .
4.1 Phân tích phương pháp bao phủ câu lệnh (statement coverage)
Trong thiết kế test case ta luôn cố gắng bao phủ tối đa câu lệnh trong mã nguồn
với số test case ít nhất có thể. Bao phủ câu lệnh sẽ nhận ra các câu lệnh trong một
phương thức hay trong một lớp đã được thực thi. Đây là một phương pháp đo đơn giản
là tìm ra số câu lệnh đã được thực thi trong tổng số các câu lệnh mã nguồn [7]. Do đó
lợi ích của bao phủ câu lệnh là khả năng tìm ra các dòng code không được thực thi. Xét
một ví dụ đơn giản. Mã nguồn của chương trình như sau:
public class StatementCoverage {
public void FunctionPrint ()
{
20
System.out.println("This is example about statement coverage"); }
public static void main (String [] args)
{
StatementCoverage hi=new StatementCoverage();
hi.FunctionPrint(); }
}
Trong chương trình mã nguồn trên ta nhận thấy có :
o Số lớp : 1 lớp (lớp StatementCoverage).
o Số phương thức : 3 phương thức :
Main()
FunctionPrint()
Println()
o Số dòng lệnh : 6 dòng.
Sử dụng công cụ EMMA (open source) đo bao phủ dòng lệnh,(phần giới thiệu và
cách cài đặt công cụ EMMA sẽ được giới thiệu ở phần phụ lục) kiểm tra các dòng mã
nguồn đã được thực thi ta được báo cáo kết xuất như sau :
Hình 1 : Kết quả kiểm tra mã nguồn được thực thi
21
Kết quả kết xuất ở trên thông báo có số gói được tìm thấy là một, tổng số lớp có
trong chương trình là một, tổng số phương thức trong lớp là ba, tổng số file thực thi là
một và tổng số dòng đã thực thi là sáu. Với kết quả báo cáo như trên ta nhận thấy 100%
mã nguồn đã được thực thi.
Tuy nhiên bao phủ dòng lệnh có nhược điểm là không thể nhận ra các lỗi xảy ra
từ cấu trúc luồng điểu khiển trong mã nguồn như là khi ghép các điều kiện hay các nhãn
switch liên tiếp. Điều này có nghĩa là báo cáo bao phủ của ta vẫn sẽ kết suất ra kết quả
báo cáo là 100% code đã được bao phủ nhưng thực tế thì các lỗi đã không được bắt. Ví
dụ ta xét hàm returnInput() sau:
public int returnInput(int x, boolean condition1, boolean condition2, boolean
condition3)
{ if (condition1)
x++;
if(condition2)
x--;
if(condition3)
x=x;
return x;
}
Trong phương thức returnInput() ở trên có 7 câu lệnh trong nó. Kết quả mong
muốn là giá trị đầu ra bằng với giá trị đầu vào. Ta sẽ kiểm tra hoạt động của hàm trên
bằng cách thiết lập ca kiểm thử với các giá trị truyền vào hàm :
int x=1;
boolean condition1=true;
boolean condition2=true;
boolean condition3=true;
Chương trình mã nguồn đầy đủ :
public class Path {
public int returnInput(int x, boolean condition1, boolean condition2, boolean
condition3)
22
{if (condition1)
x++;
if(condition2)
x--;
if(condition3)
x=x;
return x;
}
public static void main (String [] args)
{int x=0;
boolean condition1=true;
boolean condition2=true;
boolean condition3=true;
Path constructorInstance=new Path();
int methodReturn=constructorInstance.returnInput (x,condition1,
condition2,condition3); } }
Kiểm tra các câu lệnh đã được thực thi ta được có kết quả báo cáo: tổng số gói là
1, tổng số lớp là 1, tổng số file là 1, tổng số phương thức là 3, tổng số dòng đã thực thi
là 16. Minh hoạ kết quả báo cáo bao phủ câu lệnh như sau.
23
Hình 2 : Kết quả đo bao phủ dòng lệnh
Kết quả nhận được là chương trình được bao phủ 100% nhưng thực tế rõ ràng đã
có một lỗi trong hàm returnInput(). Nếu ta đánh giá nhánh đầu tiên hoặc nhánh thứ hai
là “true” thì kết quả trả lại của hàm không như mong muốn, giá trị trả lại không bằng
với giá trị đầu vào. Lỗi này thật nguy hiểm, nếu người quản lý xem kết quả bao phủ
100%, quyết định việc test đã hoàn thành thì sản phẩm phát hành sẽ có lỗi.
Như vậy có thể nói bao phủ dòng lệnh không báo cáo về các vòng lặp tới các
điều kiện lặp, nó chỉ báo cáo phần thân của vòng lặp có được thực thi hay không. Với
ngôn ngữ C, C++ và Java thì hạn chế này ảnh hưởng tới các vòng lặp. Đối với vòng lặp
“do-while” khối lệnh sau “do” được thực hiện ít nhất một lần, bao phủ dòng lệnh xem
chúng giống với các câu lệnh không rẽ nhánh. Bao phủ câu lệnh không thể phân biệt
các nhãn switch liên tiếp[6]. Nhìn chung các ca kiểm thử tương thích với các nhánh hơn
là với các câu lệnh. Ta sẽ không thể tạo ra 10 ca kiểm thử riêng biệt cho 10 câu lệnh
không rẽ nhánh mà ta sẽ tạo ra một ca để kiểm tra chúng. Ví dụ : xem xét câu lệnh “if-
else”. Có một câu lệnh theo sau mệnh đề “if” và có 99 câu lệnh theo sau mệnh đề
“else”. Sau khi áp dụng một trong hai đường đi có thể, bao phủ cậu lệnh cho ta kết quả
bao phủ hoặc 1% hoặc là 99 %. Bao phủ câu khối lệnh thường lờ đi vấn đề này. Trước
những hạn chế của bao phủ câu lệnh ta có thể tìm đến một kỹ thuật bao phủ khác tốt
hơn đó là bao phủ nhánh.
4.2 Phân tích phương pháp bao phủ nhánh (branch coverage)
Một nhánh là một kết luận logic của một quyết định, do vậy bao phủ nhánh đơn
giản là đo kết luận logic nào đã được kiểm tra. Phương pháp bao phủ này xem xét mã
nguồn sâu sắc hơn là phương pháp bao phủ câu lệnh. Xác định số nhánh có trong một
phương thức là một việc dễ làm. Kết luận kiểu boolean hiển nhiên có hai kết luận logic
là “true” hoặc “false” do đó chương trình có N quyết định sẽ có 2N nhánh. Phương pháp
bao phủ nhánh vẫn có những đơn giản như ở bao phủ câu lệnh tuy nhiên nó đã loại bỏ
được một số hạn chế có ở bao phủ câu lệnh. Tổng số quyết định tác động lên một
phương thức bằng với tổng số nhánh cần được bao phủ và nhánh entry trong phương
thức. Quay trở lại với ví dụ :
public class Path {
public int returnInput(int x, boolean condition1, boolean condition2, boolean
condition3)
24
{ if(condition1)
x++;
if(condition2)
x--;
if(condition3)
x =x;
return x; } }
Trong ví dụ này ta sẽ có 7 nhánh: 3 nhánh “true”, 3 nhánh “false” và một nhánh
entry. Nhận thấy rằng để bao phủ 7 nhánh này ta chỉ cần đến 2 test case như sau :
Test case 1 :
public void testReturnInputIntBooleanBooleanBoolean_Path1(){
int x=0;
boolean condition1=true;
boolean condition2=true;
boolean condition3=true;
Path contructorInstance=new Path();
Int methodReturn= constructorInstance.returnInput(x, condition1,
condition2,condition3);
}
Test case 2 :
public void testReturnInputIntBooleanBooleanBoolean_Path2(){
int x=0;
boolean condition1=false;
boolean condition2=false;
boolean condition3=false;
Path contructorInstance=new Path();
25
int methodReturn= constructorInstance.returnInput(x, condition1,
condition2,condition3);
}
Biên dịch chương trình đầy đủ kiểm tra với test case 1
public class Path {
public int returnInput(int x, boolean condition1, boolean condition2, boolean
condition3)
{ if(condition1)
x++;
if(condition2)
x--;
if(condition3)
x=x;
return x;
}
public static void main(String []args)
{
int x=0;
boolean condition1=true;
boolean condition2=true;
boolean condition3=true;
Path constructorInstance=new Path();
int methodReturn= constructorInstance.returnInput(x, condition1,
condition2,condition3);
System.out.println("Ket qua mong doi : output value = input value");
System.out.println("output value :"+methodReturn);} }
Kết quả test 1:
26
Hình 3 : Kết quả thực hiện test case 1
Cho chạy qua công cụ đo bao phủ ta được kết quả
Hình 4 : Kết quả đo bao phủ nhánh khi thực hiện test case 1
Biên dịch và chạy chương trình đầy đủ với test case 2
public class Path {
public int returnInput(int x, boolean condition1, boolean condition2, boolean
condition3)
{
if(condition1)
x++;
if(condition2)
x--;
if(condition3)
x=x;
return x;
}
27
public static void main(String []args)
{ System.out.println("Test case : false-false-false");
System.out.println("Cac cau lenh trong cac dieu kien se khong duoc thuc thi");
int x=0;
boolean condition1=false;
boolean condition2=false;
boolean condition3=false;
Path constructorInstance=new Path();
int methodReturn= constructorInstance.returnInput(x, condition1,
condition2,condition3);
System.out.println("Ket qua mong doi : output value = input value");
System.out.println("output value :"+methodReturn); } }
Kết quả test 2:
Hình 5 : Kết quả khi thực hiện test case 2
Cho chạy qua công cụ bao phủ ta được kết quả :
Hình 6 : Kết quả đo bao phủ nhánh khi thực hiện test case 2
28
Với 2 test case như trên thẩm định cả yêu cầu giá trị output bằng với giá trị input và
100% nhánh đã được bao phủ. Nhưng dễ dàng nhận thấy ngay cả khi 100% nhánh được
bao phủ thì chương trình vẫn có lỗi được tìm ra. Trong ví dụ vừa đề cập, ta đã không
kiểm tra các trường hợp : TRUE-FALSE-TRUE hay FALSE-TRUE-TRUE…Với 3
quyết định trong một phương thức như trên ta sẽ có 2^3=8 quyết định. Kiểm tra 8 cách
đi là một điều dễ dàng, nhưng có những phương thức có rất nhiều quyết định thì số
đường đi sẽ tăng theo hàm mũ. Ví dụ một phương thức có tới 10 quyết định kiểu
boolean như vậy ta sẽ có 210=1024 cách đi. Lúc này để đạt được mục tiêu bao phủ
100% câu lệnh và 100% nhánh là điều vô cùng khó khăn và không khả thi cho những
phương thức phức tạp[11].
4.3 Phân tích phương pháp bao phủ đường đi (path coverage)
Một đường đi thể hiện một luồng thực thi từ khi bắt đầu đến khi kết thúc một
hàm. Một phương thức với N quyết định sẽ có 2^N đường đi, và nếu phương thức có
chứa vòng lặp thì có thể có vô số đường đi. Nhưng may thay, ta có thể sử dụng phương
pháp được gọi là Cyclomatic Complexity [3] để làm giảm số đưòng đi mà chúng ta cần
kiểm tra. Cysclomatic complexity của một phương thức là tổng số quyết định duy nhất
trong phương thức. Cysclomatic complexity giúp ta định nghĩa số tuyến tính các đường
độc lập, được gọi là các thiết lập cơ sở qua một phương thức. Các thiết lập cơ sở là các
thiết lập các đường đi một cách ít nhất có thể. Giống như bao phủ nhánh, kiểm tra các
đường thiết lập đảm bảo kiểm tra từng quyết định nhưng không giống như bao phủ
nhánh, bao phủ đường đi đảm bảo kiểm tra tất cả các quyết định tác động động lập với
nhau. Nói một cách khác, mỗi đường đi mới “flips” chính xác nhánh đã thực thi trước
đó, các nhánh còn lại khác không thay đổi. Đây là nhân tố chủ yếu làm cho bao phủ
đường đi mạnh mẽ hơn bao phủ nhánh, đồng thời nó còn cho phép ta nhìn nhận được
những thay đổi khi một nhánh tác động lên hoạt động của một phương thức. Ta vẫn sẽ
sử dụng ví dụ trong bao phủ câu lệnh và bao phủ nhánh để minh hoạ.
public class Path {
public int returnInput(int x, boolean condition1, boolean condition2, boolean
condition3)
{
if(condition1)
x++;
29
if(condition2)
x--;
if(condition3)
x =x;
return x; } }
Để đạt được bao phủ 100% đường đi, chúng ta cần định nghĩa các đường cơ sở.
Cysclomatic complexity của phương thức này là bốn, do vậy ta cần định nghĩa bốn
tuyến đường độc lập nhau. Để thực hiện công việc này ta sẽ chọn bất kỳ đường đầu tiên
làm đường cơ sở và sau đó sẽ lật các quyết định một lần cho tới khi ta có các đường
thiết lập cơ sở.
Path 1: Chọn các giá trị “true” cho các quyết định, biểu diễn là TTT. Đây là đường đầu
tiên trong thiết lập cơ sở của ta.
Path 2 : Ta sẽ tìm đường cơ sở tiếp theo, lật quyết định đầu tiên trong đường cơ sở, đem
lại giá trị FTT, giá trị ta mong muốn quyết định tác động.
Path 3 : Lật quyết định thứ 2 trong đường cơ sở, đem lại cho ta giá trị TFT
Path 4 : Cuối cùng, lật quyết định thứ 3 trong đường cơ sở, ta được đường thứ 4 với giá
trị TTF.
Vậy đã có 4 đường là : TTT, FTT,TFT và TTF. Tiếp theo đây ta sẽ xây dựng các ca
kiểm thử và xem điều gì xảy ra. Hai đường đi TTT và FFF đã được kiểm tra trong bao
phủ nhánh.Tiến hành kiểm tra đường đi FTT và TFT:
Test case 3: Kiểm tra FTT. Thực thi đoạn code sau :
public class Path {
public int returnInput(int x, boolean condition1, boolean condition2, boolean
condition3)
{ if(condition1)
x++;
if(condition2)
x--;
if(condition3)
30
x=x;
return x; }
public static void main(String []args)
{ System.out.println("Test case : false-true-true");
System.out.println("Cac cau lenh trong cac dieu kien 1 se khong duoc thuc thi");
int x=0;
boolean condition1=false;
boolean condition2=true;
boolean condition3=true;
Path constructorInstance=new Path();
int methodReturn= constructorInstance.returnInput(x, condition1,
condition2,condition3);
System.out.println("Ket qua mong doi : output value = input value");
System.out.println("output value :"+methodReturn); } }
Kết quả :
Hình 7: Kết quả thực hiện test case 3
Đo bao phủ code ta được kết quả :
31
Hình 8 : Kết quả đo bao phủ khi thực hiện test case 3
Test case 4 : Kiểm tra TFT.Thực thi đoạn code sau :
public class Path {
public int returnInput(int x, boolean condition1, boolean condition2, boolean
condition3)
{
if(condition1)
x++;
if(condition2)
x--;
if(condition3)
x=x;
return x; }
public static void main(String []args)
{
System.out.println("Test case : true-false-true");
System.out.println("Cac cau lenh trong cac dieu kien 2 se khong duoc thuc thi");
int x=0;
boolean condition1=false;
boolean condition2=true;
boolean condition3=true;
Path constructorInstance=new Path();
int methodReturn= constructorInstance.returnInput(x,
condition1,condition2,condition3);
System.out.println("Ket qua mong doi : output value = input value");
System.out.println("output value :"+methodReturn);}
}
Kết quả :
32
Hình 9 : Kết quả thực hiện test case 4
Đo bao phủ code ta được kết quả :
Hình 10 : Kết quả đo bao phủ khi thực hiện test case 4
Với kết quả của test case 3 và 4 ta nhận được lỗi chương trình, các lỗi này không
nhận ra trong bao phủ câu lệnh và bao phủ nhánh. Kết quả mong đợi của chương trình
là giá trị đầu vào và giá trị đầu ra phải bằng nhau. Ở đây giá trị đầu vào là 0 nhưng ta đã
nhận được giá trị đầu ra là +1 và -1, vậy là lỗi đã được tìm ra. Tổng số đường cơ sở sẽ
tăng theo số quyết định nhưng lúc này đã không tăng theo hàm mũ mà vẫn đảm bảo
được yêu cầu bao phủ đầy đủ các nhánh. Ta nhận thấy rằng bao phủ đường đi bao gồm
cả bao phủ câu lệnh và bao phủ nhánh trong phương thức. Nó tác động gộp lên cả bao
phủ nhánh và bao phủ câu lệnh. Ta luôn nhớ rằng, mục đích kiểm tra của các đường cơ
sở là để kiểm tra tất cả các nhánh tác động độc lập với nhau. Kiểm tra 4 đường cơ sở
nhằm đạt được mục đích này. Ta có thể xây dựng các đường đi hoàn toàn khác nữa, nếu
ta bắt đầu với đường cơ sở FFF sau đó tiến hành “flips” như đã làm ở trên ta sẽ thiết lập
được 4 đường cơ sở hoàn toàn khác là : FFF, TFF, FTF,FFT. Kết quả của bộ 4 đường
mới này với bộ 4 đường ở trên là như nhau, đều thoả mãn tiêu chuẩn tác động độc lập
lên các quyết định. Qua đây dễ dàng nhận thấy với Cyclomatic complexity (số đường
độc lập tuyến tính đi qua mã nguồn) giúp ta giảm một nửa số test case cần tiến hành.
33
CHƯƠNG 5. PHÂN TÍCH GIÁ TRỊ ĐIỂM BIÊN
5.1 Giới thiệu
Trong nhiều chương trình có nhiều hàm có vô số giá trị đầu vào do đó việc kiểm
tra từng giá trị là vô cùng khó khăn, không khả thi. Nhưng trong vô vàn giá trị đầu vào
đó ta nên chọn giá trị nào là tốt nhất cho kiểm tra ? Lấy bao nhiêu giá trị kiểm tra là đủ
?...Một kỹ thuật được đề xuất phục vụ cho việc lựa chọn giá trị kiểm tra đó là kỹ thuật
phân hoạch tương đương (equivalence partitioning) và phân tích giá trị điểm biên
(boundary value analysis), với kỹ thuật này giúp ta giảm đáng kể số ca kiểm thủ cần
thực hiện.
Phân tích giá trị điểm biên là một kỹ thuật phổ biến và quan trọng nhất trong
việc thiết kế các ca kiểm thử. Nếu như đo bao phủ code là một kỹ thuật trong kiểm thử
hộp trắng thì phân tích giá trị điểm biên lại là một kỹ thuật kiểm thử hộp đen. Trong
kiểm thử hộp đen, các ca kiểm thử không tập trung vào cấu trúc thực bên trong logic
chương trình mà nó được lựa chọn dựa trên các chức năng mong muốn có trong sản
phẩm như trong tài liệu yêu cầu đã mô tả. Chúng ta kiểm tra chương trình có làm việc
chính xác hay không trong một vài trường hợp đặc biệt, các trường hợp đặc biệt thường
là các giá trị biên hoặc các giá trị vô cùng của biến đầu vào. Thông thường các lỗi
chương trình thường hay xảy ra ở giá trị biên. Phân tích giá trị biên thường được kết
hợp với phân hoạch tương đương (equivalence partitioning). Phân hoạch tương đương
và phân tích giá trị biên có mối quan hệ chặt chẽ với nhau, luôn đi liền với nhau, đôi khi
thật khó để phân biệt các ca kiểm thử được tạo bởi hai kỹ thuật này. Nói chung giá trị
biên được nhận dạng là giá trị viền của các lớp phân hoạch tương đương. Để hiểu được
giá trị biên trước hết ta đi tìm hiều về phân hoạch tương đương.
5.2 Phân hoạch tương đương(equivalence partitioning)
Phân hoạch tương đương là một kỹ thuật kiểm thử hộp đen. Phân hoạch tương
đương xác định số ca kiểm thử cho từng trường hợp cụ thể. Nhìn chung dùng phân
hoạch tương đương nhằm mục đích :
Giảm số ca kiểm thử
Lựa chọn các ca kiểm thử chính xác để bao hàm các trường hợp có thể.
34
Phân hoạch tương đương chia miền dữ liệu vào ra thành các vùng, mỗi vùng
chứa các dữ liệu có cùng hành vi. Đối với mỗi vùng dữ liệu do dữ liệu có cùng hành vi
nên ta chỉ cần xây dựng một ca kiểm thử để đại diện. Giá trị bên trong một vùng dữ liệu
được xem là “tương đương” do đó số ca kiểm thử sẽ giảm xuống. Dải dữ liệu đầu vào
bao gồm dải hợp lệ và dải không hợp lệ.
Ta có ví dụ : truyền tham số tháng cho ngày. Trong ví dụ này ta có các dải giá trị
hợp lệ và không hợp lệ như sau: Dải giá trị hợp lệ cho tháng là từ 1 đến 12 tương ứng từ
tháng 1 đến tháng 12, có hai dải giá trị không hợp lệ đó là nhỏ hơn hoặc bằng 0 và lớn
hơn hoặc bằng 13. Với 3 dải dữ liệu này sẽ có 3 ca kiểm thử được dề xuất tương ứng
với 3 dải.
Phân hoạch tương đương không đơn thuần là phương pháp xác định các ca kiểm
thử một các đầy đủ. Kết hợp với phân tích các giá trị biên giới giữa các vùng, ta sẽ thêm
vào các ca kiểm thử ở giá trị biên, từ đó tìm ra các ca kiểm thử hiệu quả nhất cho từng
vùng[12].
5.3 Phân tích giá trị biên (boundary value analysis)
5.3.1 Tổng quan về phân tích giá trị điểm biên
Phân tích giá trị biên là một kỹ thuật thiết kế ca kiểm thử và được sử dụng để chỉ
ra dữ liệu kiểm tra từ đó xây dựng các ca kiểm thử. Theo kinh nghiệm, đa phần các sai
sót về lập trình thường xảy ra đối với các dữ liệu biên, những nơi diễn ra tính toán cơ
học hoặc sự thao tác dữ liệu phải thay đổi cho hợp lý để chương trình xuất ra kết quả
chính xác. Ý tưởng của phân tích giá trị biên là sử dụng giá trị biến đầu vào ở các vị trí :
giá trị nhỏ nhất, giá trị lớn nhất, giá trị ngay bên trong biên, giá trị ngay bên ngoài biên,
giá trị đại điện thông thường, và các giá trị lỗi. Kết quả mong đợi là khi chương trình
làm việc chính xác với các giá trị đặc biệt này thì nó sẽ làm việc chính xác với các giá
trị thông thường bên trong miền giá trị. Để kiểm tra một phương thức nào đó việc đầu
tiên ta phải xác định dải dữ liệu hợp lệ và không hợp lệ đầu vào cùng với các điều kiện
cho chức năng được xét[10].
5.3.2 Lựa chọn các ca kiểm thử sử dụng phân tích giá trị điểm biên
Thiết lập các ca kiểm thử được chỉ ra bởi phân tích giá trị điểm biên phụ thuộc
vào cả sự yêu cầu về tính tin cậy của phần mềm và cả những giả thuyết có thể xảy ra
trong quá trình kiểm soát lỗi. Tiếp theo sau đây chúng ta sẽ thảo luận về phân tích giá
35
trị điểm biên của đơn biến (single-variable) và đa biến (multi-variable) dựa trên phân
loại phân tích giá trị biên.
5.3.3 Phân tích giá trị biên đơn biến (Single-Variable BVA)
Xem xét giá trị đầu vào để chỉ ra giá trị biên. Tất cả các giá trị biên này sẽ được
kết hợp chặt chẽ trong việc thiết lập các ca kiểm thử. Những giá trị gần biên sẽ được
thêm vào và sẽ được sử dụng để kiểm tra. Giá trị gần biên sẽ trợ giúp kiểm soát logic
các đường biên của chương trình. Ví dụ khi kiểm tra dải giá trị trong một nhánh hoặc
câu lệnh lặp người phát triển có thể sử dụng toán tử nhỏ hơn (<), toán tử nhỏ hơn hoặc
bằng (≤), toán tử lớn hơn (>). Các đoạn code được biên dịch nhưng chạy không chính
xác với các điều kiện sẽ dẫn đến lỗi. Các giá trị gần giá trị biên phải có trong các ca
kiểm thử để kiểm tra các loại lỗi này [4].Trong các ca kiểm thử thêm vào đường biên
các giá trị gần biên, quá trình phân tích giá trị biên baseline sẽ gồm một vài giá trị đầu
vào tồn tại trên danh nghĩa. Ví dụ sau sẽ minh hoạ cho quá trình phân tích giá trị biên
baseline: Xem xét chương trình với một giá trị đầu vào N, dải giá trị của N là : a ≤ N ≤
c. Các ca kiểm thử được chọn trong tập hợp giá trị baseline ={a, a+, b, c-, c}. a+ là giá
trị lớn hơn a, c- là giá trị nhỏ hơn c và b là một giá trị tồn tại trên danh nghĩa, b nằm
trong khoảng a+ và c-. Trong ví dụ này, quá trình phân tích giá trị biên baseline sẽ chỉ
ra năm ca kiểm thử. Minh hoạ bằng hình bên dưới.
baseline
Hình 11 : Tập hợp các giá trị biên baseline cho đơn biến trên một khoảng đầu vào
Nếu như quản lý lỗi là một việc then chốt sau khi kiểm tra phần mềm thì cần
phải tăng thêm các ca kiểm thử kiểm tra một cách mạnh mẽ thông qua quá trình phân
tích giá trị biên baseline, cần thêm vào các giá trị bên ngoài dải cho phép. Các ca kiểm
tra baseline được chỉ ra ở trên sẽ được thêm vào giá trị {a-,c+}, giá trị a- là giá trị bên
dưới giá trị chấp nhận a và c+ là giá trị ngay trên giá trị chấp nhận c. Cả hai giá trị {a-
,c+} dùng trong các ca kiểm thử cần phải được thực thi để xử lý trường hợp ngoại lệ
hoặc để che dấu khuyết điểm code. Quay trở lại với ví dụ trên giá trị đầu vào đơn lúc
này sẽ gồm bẩy giá trị hết sức mạnh mẽ: robust={a-, a, a+, b, c-, c, c+}. Minh hoạ bằng
hình bên dưới :
36
baseline robust
Hình 12 : Đường các giá trị baseline và robust cho đơn biến trên một khoảng đầu vào
Quá trình phân tích giá trị biên baseline hay quá trình phân tích biên rubust đều
có thể được áp dụng cho giá trị đầu vào có nhiều dải giá trị. Xem xét biến đầu vào đơn
M với hai dải giá trị con liền nhau, dải 1 được là d ≤ M < f và dải 2 là f ≤ M ≤ h. Thiết
lập các ca kiểm thử lúc này là kết hợp tất cả các ca kiểm thử được chỉ ra khi cách áp
dụng quá trình phân tích giá trị biên đối với từng dải giá trị riêng lẻ. Do vậy kết hợp kết
quả tất cả các ca kiểm thử áp dụng cho từng dải riêng rẽ ta được :
Mbaseline= {d, d+, e, f-, f} ∪ {f, f+, g, h-, h}
= {d, d+, e, f-, f, f+, g, h-, h}
Áp dụng phân tích giá trị biên robust làm M baseline tăng thêm các giá trị {d-, h+} mang
lại kết quả Mrobust = {d-, d, d+, e, f-, f, f+, g, h-, h, h+} được minh hoạ bằng hình bên
dưới
baseline robust augmentation
Hình 13 : Tập hợp các giá trị baseline và rubust trường hợp đơn biến trên hai khoảng
đầu vào
Thêm vào nhiều dải giá trị con hiển nhiên sẽ làm tăng số ca kiểm thử. Đối với hai dải
giá trị liền nhau của một biến đầu vào, phân tích giá trị biên baseline chỉ ra 9 ca kiểm
thử và phân tích giá trị biên rubust chỉ ra 11 ca kiểm thử.
5.3.4 Phân tích giá trị biên đa biến (Multi – Variable BVA)
Đối với bài toán đa biến quá trình phân tích giá trị biên lựa chọn ca kiểm thử cần
phải xem xét lỗi có thể xảy ra, trong bài viết này ta sẽ đề cập đến lỗi tại biên với đa biến
đầu vào là một kiểu lỗi (ta sẽ gọi là multiple-fault). Đối với kiểu lỗi multiple-fault [4]
được cho rằng nhiều lỗi đồng thời xảy ra, do vậy ta sẽ thêm vào các ca kiểm thử để soát
lỗi trên đồng thời nhiều biến.
Lấy ra từ ví dụ đơn biến ở trên, xét bài toán với hai biến đầu vào N và M, với dải
giá trị của N: a ≤ N ≤ c và giá trị của M trải dài trên hai dải, dải #1:d ≤ M < f , dải #2: f
≤ M ≤ h. Như dã thảo luận ở trên, các ca kiểm thử đơn biến đã chỉ ra đối với N và M là :
Nbaseline= {a, a+, b, c-, c}
37
Mbaseline= {d, d+, e, f-, f, f+, g, h-, h}
Các ca kiểm thử phân tích giá trị biên đa biến sử dụng cách phân tích các đường
biên của một biến trong khi các biến khác được giữ là một giá trị danh nghĩa. Hợp tất cả
các ca kiểm thử áp dụng cho từng biến đầu vào ta được tập các ca kiểm thử áp dụng cho
đa biến đầu vào. Trong ví dụ trên ta sẽ áp dụng cho từng biến đầu vào trên từng dải giá
trị con. Bài toán có hai giá trị đầu vào, các ca kiểm thử sẽ gồm các cặp giá trị đầu vào
(m,n) trong đó n là thành phần của Nbaseline và m sẽ là thành phần của Mbaseline .
Quan sát sơ đồ dưới đây :
Hình 14 : Tập giá trị baseline và robust của biến N trong trường hợp hai biến đầu vào
Trong hình biểu diễn trên ta biểu diễn giá trị m thay đổi(m thay đổi trong miền
Mbaseline), tại dải thứ nhất (d≤ m <f) m được biểu diễn bằng giá trị e, tại dải thứ hai (f ≤
m ≤ h) m được biểu diễn bằng g, giữ nguyên giá trị n, n được biểu diễn bằng giá trị b.
Quan sát sơ đồ ta nhận thấy có 9 ca kiểm thử được chỉ ra, tương ứng với các giá trị giao
điểm của đường thẳng qua b và giao với các đường trong miền giá trị thay đổi của m.
Tiếp theo cố định giá trị m tại hai dải giá trị, cho n thay đổi trong miền Nbaseline, biểu
diễn n bằng giá trị b, (a≤ b ≤ c). Quan sát sơ đồ biểu diễn dưới đây :
38
Hình 15 : Tập hợp giá trị baseline và rubust trên hai khoảng của biến M
trong trường hợp hai biến đầu vào
Trong trường hợp này ta nhận được 10 ca kiểm thử.
Tổng hợp cả 2 trường hợp ta nhận được sơ đồ sau :
Hình 16 : Tổng hợp tất cả các giá trị của hai biến N và M trên hai khoảng đầu vào
Trường hợp 1 cho ta 9 ca, trường hợp 2 cho ta 10 ca, tổng hợp cả 2 trường hợp cho ta
19 ca, nhưng tại các vị trí (e,b) và (g,b) được lặp lại 2 lần, nên tổng cả 2 trường hợp ta
có 17 ca kiểm thử.
39
Đối với việc kiểm tra mạnh mẽ (rubustness), áp dụng cách thức như ta đã làm
với từng biến trước đó, kết quả đã được chỉ ra trong Mrubust và Nrubust. Lưu ý rằng trong
quá trình phân tích baseline với từng biến thì đồng thời 6 giá trị rubust cũng đã được chỉ
ra (quan sát trên hình vẽ). Như vậy đến thời điểm này ta đã có tổng số 23 ca kiểm thử
tất cả.
Các ca kiểm thử trên dải giá trị không hợp lệ cần phải được lựa chọn để kiểm soát đồng
thời với cả hai biến. Quá trình phân tích giá trị biên multiple-fault sẽ được bắt đầu với
tập hợp giá trị trong Mbaseline và Nbaseline trong trường hợp các đường biên không được
kiểm tra, còn trong trường hợp việc kiểm tra các đường biên được ưu tiên cao thì ta sẽ
sử dụng với tập giá trị Mrubust và Nrubust . Tương ứng với hai trường hợp vừa nêu ta có
ước lượng tích đề-các (cartesian) Mbaselien x Nbaselien xác định số ca kiểm thử cho
baseline multiple-fault, và tích đề các Mrubust x Nrubust xác định số ca kiểm thử cho rubust
multiple-fault.
Với hai tập giá trị M và N, tích đề-các của M và N được định nghĩa là :
M x N = {(m,n) | m ε M^n ε N}
M x N là tập tất cả các cặp phần tử (m,n) được lấy ra từ tập M và tập N. Do đó, nếu tập
M có x phần tử và tập N có y phần tử, kết quả của tập M x N sẽ gồm x * y phần tử.
Trở lại bài toán ví dụ, hình dưới đây sẽ biểu diễn tổng hợp các ca kiểm thử phân tích giá
trị biên baseline và rubust được chỉ ra cho kiểu lỗi multiple-fault của bài toán.
Hình 17 : Tổng hợp toán bộ giá trị baseline, robust trường hợp đa biến đầu vào trên
hai khoảng
40
Số lượng các ca kiểm thử tăng lên đáng kể, 45 ca baseline được chỉ ra và trong trường
hợp xấu nhất (worst-case) được thêm 32 ca rubust.
Tổng hợp các ca kiểm thử cho bài toán 2 biến với các mức yêu cầu về tính tin cậy ta có
bảng như sau :
Bảng 1 : Tổng hợp các ca kiểm thử theo mức tin cậy .
Nhận thấy rằng, giả thuyết tình huống bài toán có nhiều lỗi đồng thời xảy ra cùng một
lúc đã dẫn đến khá nhiều ca kiểm thử, đặc biệt nếu như bài toán xét trên nhiều dải giá trị
thì số lượng ca kiểm thử tăng lên là đáng kể.
5.3.5 Kết luận
Từ những phân tích đã trình bày rõ ràng phân tích giá trị điểm biên có nhiều ưu
điểm quá trình phân tích giá trị điểm biên để chỉ ra các kiểm tra là một việc dễ sử dụng,
thậm chí có các giá trị biên đầu vào còn được mô tả một cách rõ ràng trong tài liệu yêu
cầu. Với phân tích giá trị biên, ta có thể điều chỉnh số ca kiểm thử do đó tài nguyên
được sử dụng cho nghiên cứu còn phụ thuộc vào đòi hỏi về tính chất mạnh của phần
mềm. Phân tích giá trị biên có lợi cho sự bắt đầu các kỹ thuật kiểm thử khác. Tài liệu
thảo luận về phân tích giá trị biên thường hoà lẫn và có liên hệ với kỹ thuật kiểm thử
hộp đen phân hoạch tương đương.
Tuy nhiên phân tích giá trị điểm biên có thể ảnh hưởng tới việc nhận ra các lỗi.
So với việc kiểm tra giá trị ngẫu nhiên và giá trị phân hoạch tương đương thì phân tích
giá trị biên có số lần kiểm tra nhiều hơn 6 lần so với kiểm tra ngẫu nhiên và gấp 2 lần
so với kiểm tra theo phân hoạch tương đương. Giá cả để kiểm tra cũng tăng theo số ca
kiểm thử.
Kỹ thuật phân tích giá trị biên cung cấp một quá trình có hệ thống cho việc đánh
giá mức độ hoàn thành và chất lượng của sản phẩm phần mềm. Đôi khi bằng cách phân
tích giá trị biên ta có thể tìm ra các ca kiểm thử dư thừa trong tập hợp ca kiểm thử được
chỉ ra. Phân tích giá trị biên cung cấp nền tảng cơ bản cho việc học các kỹ thuật khác,
cụ thể là kỹ thuật phân hoạch tương đương, trong việc chỉ ra lỗi phân tích giá trị biên có
hiệu quả như một kỹ thuật kiểm tra chức năng.
41
CHƯƠNG 6. THỰC NGHIỆM
6.1 Ví dụ một chương trình đơn giản
Nếu ta biết cấu trúc của chương trình ta có thể thiết kế các ca kiểm thử đảm bảo
bao phủ : câu lệnh, nhánh, đường đi và bao phủ các điều kiện.
Chúng ta sẽ xem xét một chương trình với cấu trúc đơn giản, phân tích chương trình và
đề xuất các ca kiểm thử để đảm bảo toàn bộ câu lệnh, toàn bộ nhánh, toàn bộ luồng đi
qua chương trình đều được bao phủ. Chương trình có hai điều kiện, theo sau điều kiện
một sẽ có hai nhánh rẽ. Nếu điều kiện một là “true” sẽ thi hành khối lệnh A thực hiện
công việc A. Nếu điều kiện một là “false” sẽ thi hành khối lệnh B thực hiện công việc
B. Xét đến điều kiện hai, nếu điều kiện hai “true” sẽ thực hiện khối lệnh C, còn nếu
điều kiện hai “false” sẽ kết thúc chương trình Mô tả ví dụ bằng sơ đồ dưới đây.
Hình 18 : Ví dụ cấu trúc một chương trình đơn giản
Khi chạy các unit test ta mong muốn kiểm tra được tất cả các công việc trong các
khối lệnh trong chương trình. Cụ thể trong ví dụ đang xét cần phải kiểm tra việc thực
hiện của các khối lệnh A, B, C xảy ra theo đúng điều kiện, khối lệnh trong từng công
việc phải hoạt động đúng. Hình vẽ sau mô tả nổi bật các công việc cần phải kiểm tra.
42
Hình 19 : Các công việc cần thực hiện (tô đậm)
6.1.1 Xây dựng các ca kiểm thử cho chương trình trên
Dựa vào cấu trúc của chương trình nguồn như trên đề xuất các ca kiểm thử kiểm
tra code trong từng nhánh có được thực thi hay không.
Test case 1 :Công việc A được thực hiện khi điều kiện một “true” do đó để kiểm tra
việc thực thi công việc A chúng ta cần gán sao cho điều kiện một “true”.
Hình 20 : Test case 1 kiểm tra công việc A
Test case 2 :Khi điều kiện một “false” câu lệnh rẽ nhánh sẽ thực hiện công việc trong
khối lệnh B. Để kiểm tra việc thực thi công việc B ta cần gán cho điều kiện một là
“false”
Hình 21 : Test case 2 kiểm tra công việc B
43
Tổng hợp lại đối với điều kiện một ta sẽ có hai ca kiểm thử để kiểm tra
Testcase #1: Condition-1 là “true”.
Testcase #2: Condition-1 là “false“
Test case 3 :Xét đến điều kiện hai.Khi điều kiện hai là “true” thì khối lệnh C sẽ được
thực hiện. Do đó kiểm tra việc thực thi công việc C ta sẽ gán cho điều kiện 2 là “true”.
Hình 22 : Test case 3 kiểm tra công việc C
Testcase #3: condition-2 là “true”.
Để kiểm tra các công việc A, B, C ba test case đã được đề xuất. Tuy nhiên có thể
dễ dàng nhận thấy điều kiện 1 và là 2 bộ phận độc lập nhau.
Hình 23 : Hai điều kiện một và hai là độc lập nhau
Do đó bao phủ toàn bộ 3 công việc này ta chỉ cần dùng đến 2 test case là 100% câu lệnh
được bao phủ. Test case 1 kiểm tra đồng thời công việc A và công việc C
44
Hình 24 : Kiểm tra đồng thời công việc A và công việc C trong cùng 1 test case
Test case 2 kiểm tra công việc B và công việc C:
Hình 25 : Test case kiểm tra đồng thời công việc B và C
Test case Condition - 1 Condition-2
#1 TRUE TRUE
#2 FALSE TRUE
Thiết kế 2 test case như trên thì 100% câu lệnh đã được kiểm tra. Mặc dù đã bao
phủ 100% nhưng đã có một điều kiện không được bao phủ và một nhánh không được
bao phủ. Cụ thể là trong điều kiện thứ 2 điều kiện “false” đã không được bao phủ. Và
nhánh không được bao phủ là :
45
Hình 26 : Nhánh không được bao phủ
Thay một điều kiện của condition-2 là “false” ta được bảng tồng hợp các giá trị dùng
trong các ca kiểm thử như sau:
Test case Condition-1 Condition-2
#1 TRUE TRUE
#2 FALSE FALSE
Nếu xem như các biểu thức trong các điều kiện của ta là các biểu thức boolean
nguyên tử (tức là không chứa các phép toán logic như and, or, xor) thì lúc này ta nhận
thấy là toàn bộ nhánh và toàn bộ điều kiện đã được bao phủ.
Tuy nhiên mặc dù 100% câu lệnh và 100% nhánh đã được bao phủ thì vẫn có lỗi
được tìm ra. Chúng ta mới bao phủ được 2 đường đi, với 2 giá trị “true” “false” của hai
điều kiện. Tổ hợp các điều kiện với nhau ta có 4 cách đi có thể do đó sẽ có 4 ca kiểm
thử được đề xuất như sau :
Test case Condition-1 Condition-2
#1 TRUE TRUE
#2 FALSE FALSE
#3 TRUE FALSE
#4 FALSE TRUE
46
6.1.2 Kết luận
Như vậy dựa vào việc phân tích từng mức bao phủ : bao phủ dòng lệnh, bao phủ
nhánh, bao phủ đường đi ta đã thiết kế được một bộ test case hoàn chỉnh, đảm bảo tất cả
các câu lệnh đã được kiểm tra, các nhánh, các đường đi có thể đều đã được bao phủ.
6.2 Chương trình cài đặt tìm kiếm các câu lệnh rẽ nhánh trong mã nguồn
java.
Từ những phân tích về bao phủ code chúng tôi nhận thấy trong quá trình bao phủ
nhánh sẽ bao hàm kiểm tra bao phủ câu lệnh, đồng thời trong phương pháp bao phủ
đường đi tổ hợp các đường đi có thể cần dựa trên các nhánh rẽ trong chương trình. Bên
cạnh đó trong các câu lệnh điều kiện, câu lệnh lặp thường chứa các dải giá trị của biến
đầu vào. Do đó có thể nói việc nhận ra các câu lệnh rẽ nhánh, câu lệnh lặp là rất cần
thiết. Khi có tập các lệnh rẽ nhánh ta có thể tiến hành xây dựng các ca kiểm thử, dựa
vào dải giá trị trong nó ta có thể xác định giá trị biên cho biến đầu vào. Trong phần này
chúng tôi xây dựng chương trình tìm kiếm câu lệnh rẽ nhánh trong file nguồn java, chỉ
ra giá trị biên trong dải giá trị đầu vào của câu lệnh điểu khiển.
6.2.1 Giới thiệu về chương trình
Ngôn ngữ lập trình sử dụng : Java.
Công cụ lập trình sử dụng : eclipse.
Giao diện giao tiếp với người sử dụng qua màn hình console
6.2.2 Mô tả các chức năng chính
Cho phép người sử dụng nhập vào tên file cần đọc. Yêu cầu file đọc phải là
file có mở rộng *.java. Nếu người dùng nhập vào file không phải là file định
dạng .java chương trình sẽ hiển thị thông báo không phải là một file java.
Nhập vào tên file dùng để lưu câu lệnh điều khiển. Kiểm tra tên file vừa nhập
đã tồn tại hay chưa. Nếu tên file đã tồn tại yêu cầu người dùng phải nhập vào
tên khác.
Chương trình xuất ra các thông báo nếu file được đọc thành công. Xuất ra
tổng số câu từng loại câu lệnh rẽ nhánh if, while, for đã tìm kiếm được.
Chương trình đưa ra lựa chọn hỏi người dùng có muốn tiếp tục thao tác. Nhập
vào “Yes’ để tiếp tục. Sau đó người dùng cần phải chọn loại câu lệnh rẽ nhánh
if hay while hay for để thao tác. Nhập vào tên file sẽ lưu những câu lệnh đó.
47
Và cuối cùng là chọn câu lệnh cần thao tác bằng cách nhập vào một số nguyên
chỉ số thứ tự của câu lệnh. Chương trình sẽ xuất ra câu lệnh mà người dùng đã
chọn. Chỉ ra giá trị biên trong dải giá trị đầu vào.
6.2.3 Biểu đồ trình tự
Với các chức năng liệt kê ở trên trình tự tương tác giữa người dùng và hệ thống
như sau. Biểu đồ trình tự dưới đây mô tả tương tác của người dùng muốn tìm ra toàn bộ
câu lệnh điểu khiển có trong file nguồn java, đếm từng loại câu lệnh điều khiển.
Hình 27. Biểu đồ trình tự
Biều đồ trình tự dưới đây thể hiện tương tác giữa người dùng và hệ thống khi
người dùng muốn thao tác trên từng câu lệnh if để chỉ ra giá trị biên của chính câu lệnh
đó
48
Hình 28: Biều đồ trình tự khi tương tác câu lệnh if
Biểu đồ trình tự dưới đây thể hiện tương tác giữa người dùng và hệ thống khi
người dùng muốn thao tác trên câu lệnh while và xuất ra giá trị biên của chính câu lệnh
đó.
Hình 29: Biều đồ trình tự khi tương tác câu lệnh while
49
Biểu đồ trình tự dưới đây thể hiện tương tác giữa người dùng và hệ thống khi
người dùng muốn thao tác trên câu lệnh for và xuất ra giá trị biên của chính câu lệnh đó
Hình 30: Biểu đồ trình tự khi tương tác câu lệnh for
6.2.4 Thuật toán đã sử dụng
Cài đặt chương trình thực hiện những chức năng trên chủ yếu dùng kiến thức về
java core. Sử dụng các thuộc tính và các phương thức của lớp vào ra chuẩn (java.io.*;)
là lớp (java.lang.String;).
Khi người dùng nhập vào tên file cần đọc, một đối tượng BufferedReader được
khởi tạo để lưu tên file nhập vào. Yêu cầu định dạng của file nhập vào phải là file
*.java. Kiểm tra phần mở rộng của file dùng hàm:
object. endsWith(“.java”)
Yêu cầu tiếp theo người dùng cần nhập vào tên file sẽ lưu toàn bộ các câu lệnh
điều khiển của file cần đọc.
đối tượng BufferedReader để lưu tên file nhập vào
hàm createNewFile () để tạo file với tên vừa nhập
sử dụng boolean exist=fout.createNewFile() để kiểm tra tên file
vừa nhập vào đã tồn tại hay chưa.
50
Đọc file : sử dụng các lớp FileInputStream, DataInputStream và
BufferedReader. Chúng tôi sẽ tiến hành đọc từng dòng trong file sử dụng hàm
readLine(). Duyệt toàn bộ file cho tới khi gặp dòng rỗng (null). Khi đọc từng dòng sẽ
tiến hành đọc từng ký tự lưu vào một mảng kiểu char (mảng token[]). Câu lệnh rẽ
nhánh if sẽ có dạng if(biểu thức logic boolean). Chúng tôi sẽ tiến hành so sánh phần tử
thứ (i) trong mảng char token[], nếu như token[i] = = ‘i’ và token[i+1]= = ‘f’ thì sẽ thực
hiện vòng lặp để in cả câu lệnh if đó ra file lưu trữ. Để làm được điều này chúng tôi sử
dụng hàm charAt(i) để chuyển phần tử thứ (i) thành kiểu char, dùng đối tượng thuộc
lớp BufferedWriter để ghi ra file lưu trữ.Việc tìm kiếm câu lệnh while và for cũng
tương tự như thực hiện với câu lệnh if. Đối với câu lệnh while tiến hành so sánh nếu tất
cả các phần tử có dạng sau sẽ in ra câu lệnh while:
token[i]= = ‘w’
token[i+1]= = ‘h’
token[i+2]= = ‘i’
token[i+3]= = ‘l’
token[i+4]= = ‘e’
Một dòng lệnh là câu lệnh for thì các phần tử trong dòng đang đọc phải có dạng như sau
:
token[i]= = ‘f’
token[i+1]= = ‘o’
token[i+2]= = ‘r’
Khai báo các biến đếm count_if, count_while, count_for, mỗi lần một câu lệnh điều
khiển được tìm thấy các biến đếm này sẽ được tăng lên một theo đúng loại câu if hay
while hay for.
Người dùng muốn tiếp tục thao tác. Cần phải nhập vào “Yes”, muốn thoát phải nhập
vào “No”. Nếu xâu nhập vào là “Yes” sẽ thực thi khối lệnh tiếp theo: hỏi người dùng
lựa chọn loại câu lệnh điều khiển sẽ thao tác. Nếu người dùng muốn thao tác câu lệnh if
thì nhập vào if , khi muốn thao tác trên while nhập vào while và nếu là for thì cần nhập
vào for. Để biết người dùng đã nhập vào những lựa chọn nào sẽ dùng đến đối tượng lớp
BufferedReader để đọc, hàm so sánh xâu equals(String object) . Người dùng chọn
câu lệnh muốn thao tác bằng cách nhập vào một số nguyên (kiểu int). Để lấy ra đúng
51
câu lệnh là số thứ tự mà người dùng vừa nhập sẽ phải dùng đến đối tượng kiểu
LineNumberReader và gọi đến hàm getLineNumber().
Giá trị biên trong các dải giá trị của biến luôn nằm đằng sau các toán tử so sánh >, >=,
<, <= do đó thuật toán để lấy ra các giá trị biên trong các câu lệnh điều khiển sẽ là tiến
hành đọc qua file, đọc từng dòng một, xét câu lệnh đó có phải là câu lệnh điều khiển
hay không, nếu là câu lệnh điều khiển sẽ lấy ra xâu đằng sau các toán tử so sánh trên.
Duyệt qua file và đọc từng ký tự về cách làm tương tự như đã làm ở trên.
6.2.5 Các lớp cài đặt
Cài đặt lớp để lấy tên file cần đọc do người dùng nhập vào
Hình 31: Kiến trúc lớp cài đặt Get_File_Name
Cài đặt lớp ReadContenFile thực thi các chức năng của chương trình
Hình 32: Kiến trúc lớp ReadContentFile.
6.2.5 Kết quả thao tác các chức năng giữa người dùng và chương trình như sau
52
Giao diện yêu cầu nhập tên file cần đọc
Hình 33: Giao diện yêu cầu nhập tên file cần đọc
Nhập vào một file không phải là định dạng *.java, hệ thống sẽ xuất ra thông báo “This
is not a java file” đây không phải là một file java.
Hình 34: Nhập tên file không đúng định dạng *.java
Nhập vào một tên file đúng để đọc, chúng tôi thử nghiệm bằng cách đọc file
“TestFile.java”.
Hình 35: Nhập vào một tên file đúng để đọc
Nội dung bên trong của file đã sử dụng (file TestFile.java) như sau
Hình 36 : Nội dung của file TestFile.java
53
Sau khi nhập vào tên file cần đọc, hệ thống sẽ yêu cầu nhập vào một tên file để
lưu toàn bộ câu lệnh điều khiển của file cần đọc. Kết quả sau khi tìm kiếm câu lệnh điều
khiển như sau
Hình 37: Kết quả tìm kiếm câu lệnh điều khiển
Mở file ghi câu lệnh điều khiển, nội dung file như sau
Hình 38 : Nội dung của file chứa câu lệnh điều khiển được tìm kiếm
54
Sau khi tìm kiếm câu lệnh điều khiển, hệ thống sẽ hỏi người dùng có muốn tiếp
tục thao tác. Để tiếp tục thao tác người dùng phải nhập vào “Yes”. Có ba lựa chọn cho
người dùng, nhập vào “if” để thao tác với câu lệnh if, nhập vào “while” để thao tác với
câu lệnh while, nhập vào “for” để thao tác với câu lệnh for. Nhập vào tên file để lưu
toàn bộ lệnh điều khiển đã chọn. Sau đó người dùng phải nhập vào một số nguyên để
chọn câu lệnh cần thao tác. Ví dụ khi muốn thao tác với câu lệnh if số “2” thì sẽ phải
nhập vào “2”. Kết quả khi người dùng tiếp tục muốn thao tác với câu lệnh if.
Hình 39 : Kết quả khi người dùng muốn thao tác với câu lệnh if
Trong tương tác trên, người dùng đã chọn câu lệnh điều khiển if để thao tác,
dùng file “if_save.txt” để lưu toàn bộ câu lệnh if trong đó. Nhập vào số nguyên “2” để
thao tác với câu lệnh if số 2. Hệ thống xuất ra nội dung của câu lệnh là “if(a>b)”. Giá trị
biên được chỉ ra ở đây là “b”.
Các thao tác cũng làm tương tự như câu lệnh if khi người dùng muốn thao tác trên lệnh
while. Kết quả khi người dùng tiếp tục muốn thao tác với câu lệnh while như sau.
55
Hình 40 : Kết quả khi người dùng muốn thao tác với câu lệnh while
Trong tương tác trên người dùng chọn tương tác với câu lệnh “while”, dùng file
“while_save.txt” để lưu toàn bộ câu lệnh while, nhập vào số nguyên “3” để thao tác với
câu lệnh while số 3. Nội dung của câu lệnh while này là “while(a>b)”. Giá gị biên
được chỉ ra ở đây là “b”.
Các thao tác cũng làm tương tự như câu lệnh if khi người dùng muốn thao tác trên lệnh
for. Kết quả khi người dùng tiếp tục muốn thao tác với câu lệnh for
Hình 41 : Kết quả khi người dùng muốn thao tác với câu lệnh for
Trong tương tác trên, người dùng chọn tương tác với câu lệnh “for”, dùng file
“for_save.txt” để lưu toàn bộ câu lệnh for, nhập vào số nguyên “2” để thao tác với câu
lệnh for số 2. Nội dung của câu lệnh for này là “for(int i=0;a>121313;i++)”. Giá trị biên
được chỉ ra ở đây là “121313”.
56
6.3 Kết luận
Như vậy chúng tôi đã cài đặt thành công chương trình tìm kiếm toàn bộ câu lệnh
điểu khiển trong một file java bất kỳ. Xuất ra được giá trị biên trong các biểu thức đánh
giá của dải giá trị đầu vào. Danh sách những câu lệnh điều khiển này sẽ được dùng vào
mục đích tạo ra các ca kiểm thử nhằm đặt tới mục tiêu thiết kế các ca kiểm thử đủ tốt để
bao phủ tối đa mã nguồn. Chỉ ra giá trị biên giúp cho người kiểm tra đề xuất các giá trị
kiểm tra baseline và robust.
57
CHƯƠNG 7: KẾT LUẬN KHOÁ LUẬN
7.1 Kết luận về khoá luận
Trong quá trình thực hiện khoá luận này, chúng tôi đã tìm hiểu những kiến thức
cơ bản về kiểm thử phần mềm, giai đọan vô cùng quan trọng giúp phát triển và sửa lỗi
nhằm đảm bảo chất lượng phần mềm. Đồng thời, chúng tôi đã nghiên cứu, phân tích hai
kỹ thuật phục vụ cho việc thành lập các ca kiểm thử tốt. Một kỹ thuật thuộc về kiểm thử
hộp trắng là : phân tích bao phủ code và một kỹ thuật thuộc về kiểm thử hộp đen là :
phân tích giá trị điểm biên. Trong phần phân tích về kỹ thuật bao phủ code chúng tôi đã
chỉ ra những ưu nhược điểm của các phương pháp bao phủ cơ bản là : bao phủ dòng
lệnh, bao phủ nhánh và bao phủ đường đi. Nhìn chung phương pháp bao phủ đường đi
đã bao gồm cả 2 phương pháp bao phủ câu lệnh và bao phủ nhánh. Với kỹ thuật phân
tích bao phủ code đòi hỏi chúng ta phải tìm hiểu sâu sắc về mã nguồn. Thiết kế các ca
kiểm thử thích hợp để tìm ra những dòng lệnh không được thực thi, những dòng lệnh dư
thừa. Quá trình này là một vòng lặp: từ kết quả của ca kiểm thử ta có thể đánh giá được
mã nguồn, đồng thời đánh giá được ca kiểm thử vừa xây dựng đã tốt, đã tối ưu hay
chưa từ đó xây dựng ca kiểm thử tiếp theo hay hơn, có mức bao phủ code nhiều hơn.
Với việc phân tích giá trị điểm biên chúng tôi cũng đã chỉ ra những giá trị cần phải
được kiểm tra trong dải giá trị đầu vào của các biến. Để khắc phục những sai sót về lập
trình xảy ra tại những điểm biên cần phải tiến hành các ca kiểm thử kiểm tra tập giá trị
baseline và robust.
Tuy nhiên, hai kỹ thuật đề xuất này cũng gặp phải những khó khăn. Với những
phương thức phức tạp với nhiều câu lệnh rẽ nhánh, nhiều biểu thức logic trong từng câu
lệnh rẽ nhánh thì số ca kiểm thử thiết kế để đảm bảo bao phủ 100% là một con số vô
cùng lớn, và đôi khi ngay cả khi báo cáo 100% code được bao phủ nhưng trên thực tế
vẫn có lỗi được tìm ra. Do đó bên cạnh kỹ thuật phân tích bao phủ code chúng ta cần
phải tiến hành các phương pháp kiểm thử khác, kiểm thử các mức khác nhau để sớm
tìm ra lỗi. Trong kỹ thuật phân tích giá trị điểm biên cũng gặp phải những khó khăn như
nếu biến đầu vào có nhiều dải giá trị thì số lượng các ca kiểm thử robust cũng tăng lên
đáng kể. Và trước khi tiến hành phân tích giá trị điểm biên ta phải tiến hành phân hoạch
tương đương miền giá trị đầu vào, việc phân hoạch này không phải lúc nào cũng chính
xác tuyệt đối.
7.2 Hướng nghiên cứu phát triển trong tương lai
58
Từ những vấn đề còn tồn tại của khoá luận này, trong tương lai, chúng tôi sẽ tiếp
tục theo hướng nghiên cứu này nhằm xây dựng một công cụ đo bao phủ code cho ngôn
ngữ java. Bên cạnh đó là xây dựng chương trình tự động tìm ra giá trị biên ngẫu nhiên
dùng trong các ca kiểm thử biên.
59
TÀI LIỆU THAM KHẢO
[1] Study of Average Error Rates for Censorware Programs – Bennett Haselton.
[2] Introduce to code coverage –Lasse K oskela Accenture Technology Solutions -2004
[6] Statement Coverage & Decision Coverage – Shailaja Kiran
[7] Statement, Branch, and Path Coverage Testing in Java – Joe Ponczak
[4] A Review of Boundary Value Analysis Techniques Dr. David J. Coe, The University
of Alabama in Huntsville
[5] http:// www. Wikipedia. Org
[6] Measuring the multiple-condition converage with test suites for AspectJ programs –
Arnold Zanderink
[3] Beizer, B.(1990). Software Testing Techniques. Boston, International Thompson
Comtuter Press.
[4] Beizer, B.(1995). Black Box Testing. New York, John Wiley & Sons, Inc.
IEEE(1987). “ANSI/IEEE” Standard 1008-1987, IEEE Standard for Software Unit
Testing.” IEEE (1990). IEEE Standard 610.12 – 1990. IEEE Standard Glossary of
Software Engineering Terminology.
[5] Kaner, C., J. Falk, et al. (1999). Testing Computer Software. New York, Weley
Computer Publishing.
[10] Testing via Boundary Value Analysis – Craig Borysowich Chief Technology
Tactician.
[11] PathExpander: Architectural Support for Increasing the Path Coverage of
Dynamic Bug Detection - Shan Lu, Pin Xhou, Wei Liu, Yuanyuan Zhou and Josep
Torrellas Department of Computer Science.
[12] Equivalence partitioning and Boundary Value Analysis – IOTAP Quality
Assurance Team.
Các file đính kèm theo tài liệu này:
- LUẬN VĂN- NGHIÊN CỨU VỀ MỨC BAO PHỦ CỦA KIỂM THỬ.pdf