Đăng ký Đăng nhập với Googleplus

Luận văn Thạc sỹ Công nghệ thông tin Tìm hiểu phương pháp phân tích bằng bên trong tài liệu ảnh

Người gửi: Nguyễn Trí Đức
Ngày đăng: 17/11/2016
Dung lượng: 3,626Mb
Ngôn ngữ: Tiếng Việt
Tác giả:
Nhà xuất bản: Sưu Tầm
Năm xuất bản: 2009
Số trang: 74
Đánh giá:
Nhận xét: 0
Download: 0
Loại download: Free
Phí download: Free
Mô tả:

MỤC LỤC

Trang phụ bìa

Lời cảm ơn

MỤC LỤC-------------------------------------------------------------------------------i

THUẬT NGỮ TIẾNG ANH:---------------------------------------------------------iii

DANH MỤ C CÁ C HÌNH VẼ --------------------------------------------------------iv

CHƢƠNG I: MỞ ĐẦU----------------------------------------------------------------1

1.1. Cơ sở nghiên cứu và mục đích của luận văn----------------------------3

1.2. Tổ chức của luận văn:--------------------------------------------------------4

CHƢƠNG II: TỔNG QUAN VỀ HỆ PHÂN TÍCH TÀI LIỆU ẢNH ---------5

2.1. Tài liệu ảnh ---------------------------------------------------------------------5

2.2. Hệ phân tích trang tài liệu --------------------------------------------------5

2.3. Thu thập dữ liệu ảnh ---------------------------------------------------------6

2.4. Tiền xử lý điểm ảnh-----------------------------------------------------------9

2.4.1. Xử lý nhị phân ----------------------------------------------------------10

2.4.2. Giảm nhiễu---------------------------------------------------------------11

2.4.3. Phân đoạn ảnh -----------------------------------------------------------12

2.4.4. Làm mảnh và xác định vùng -----------------------------------------12

2.4.5. Mã hóa CC và véctơ hóa ----------------------------------------------13

2.5. Phân tích đặc trƣng của tài liệu ảnh -------------------------------------15

2.6. Phân tích đối tƣợng văn bản trong tài liệu -----------------------------15

2.6.1. Xác định góc nghiêng của văn bản ----------------------------------16

2.6.2. Phân tích bố cụ c của trang tà i liệu ảnh ------------------------------18

2.7. Nhận dạng ký tự quang học (OCR)---------------------------------------19

2.7.1. Thuật toán OCR-----------------------------------------------------20

2.7.1.1. Trích chọn đặc trƣng ---------------------------------------20

2.7.1.2. Phân loại------------------------------------------------------21

2.7.2. Nhận dạng ký tự dựa trên ngữ cảnh------------------------------21

2.8. Phân tích các đối tƣợng ảnh trong tài liệu ------------------------------22

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

CHƢƠNG 3: THUẬT TOÁN TÁCH VĂN BẢN - ẢNH TỪ TRANG TÀI

LIỆU ẢNH ------------------------------------------------------------------------------24

3.1. Tổng quan về phân tách văn bản – ảnh ---------------------------------24

3.2. Những đặc trƣng chung của một tệp tài liệu ảnh ---------------------27

3.3. Thuật toán phân tách văn bản - ảnh--------------------------------------30

3.3.1. Xoá bỏ các đối tƣợng tuyến tính ---------------------------------31

3.3.2. Phân tích các thành phần liên thông của nét bút ---------------32

3.3.3. Kết hợp các nét ký tự tạo thành các chuỗi văn bản------------34

3.3.4. Thực hiện các phép toán hình thái -------------------------------35

3.3.5. Phân tích các thành phần liên thông mới -----------------------35

3.3.6. Biểu diễn cấu trúc thông tin của các chuỗi văn bản -----------36

CHƢƠNG IV: PHƢƠNG PHÁP PHÂN TÍCH BẢNG T-RECS TRONG

TRANG TÀI LIỆ U ẢNH------------------------------------------------------------39

4.1. Giới thiệu--------------------------------------------------------------------39

4.2. Thuật toán phân đoạn khởi tạo ----------------------------------------41

4.2.1. Trƣờng hợp thuật toán nhận dạng sai cột -----------------------42

4.2.2. Cải tiến các bƣớc của thuật toán phân đoạn khởi tạo T - Recs++ 44

4.2.3. Những ƣu điểm của thuật toán -----------------------------------46

4.2.4. Những mặt hạn chế của thuật toán khởi tạo --------------------47

4.3. Các bƣớc xử lý khối sau khi phân đoạn------------------------------48

4.3.1. Trộn các khối phân đoạn sai --------------------------------------48

4.3.2. Phân tách các cột bị trộn vào một khối--------------------------49

4.3.3. Nhóm các từ bị phân tách -----------------------------------------52

4.4. Phân tích khối--------------------------------------------------------------53

4.5. Xác định cấu trúc các cột, hàng----------------------------------------54

CHƢƠNG 5 CHƢƠNG TRÌNH THƢ̉ NGHIỆM VÀ MINH HỌ A THUẬ T

TOÁN T-RECS++ ---------------------------------------------------------------------56

5.1. Mô tả chƣơng trình -------------------------------------------------------56

5.2. Một số kết quả -------------------------------------------------------------58

KẾT LUẬ N VÀ ĐỀ XUẤ T ----------------------------------------------------------61

Gửi bình luận
Hãy đăng nhập để được bình luận

0.91830 sec| 1941.852 kb