Các nhà khoa học Trung Quốc vừa thành công số hóa tất cả các ký tự chữ Hoa với công nghệ mã hóa 4-byte cho phép in được các chữ viết cổ chứa nhiều ký tự hiếm.
Theo ông Wang Hongyuan, người sáng chế ra công nghệ mã hóa, họ sẽ hỗ trợ người sử dụng gõ và tìm tất cả các ký tự tiếng Hoa và giải quyết khó khăn do các chữ tượng hình đặc biệt hiếm đã bị cắt bỏ trong đời sống hàng ngày.
Ông Wang nêu thí dụ như dịch vụ ngân hàng, nếu tên một người chứa ký tự hiếm gặp, họ sẽ gặp phải khó khăn trong việc lập tài khoản bởi hệ thống máy tính ngân hàng không có đủ chức năng để mã hóa và nhận ra tên người đó.
Với mã 4-byte, mọi người sẽ có thể gõ vào 70.000 ký tự trong máy tính được cài đặt một cơ sở dữ liệu đã được sắp xếp. Ông Wang cho biết, mã 2-byte chỉ có thể xử lý được 20.000 ký tự.
Theo thống kê, có khoảng 60 triệu người Trung Quốc trong số 1,3 tỷ người có tên chứa ký tự đặc biệt.
Ông Wang cho biết, mặc dù một số phương pháp in ấn ký tự đặc biệt đã được thực hiện, nhưng chưa có một cơ sở dữ liệu chứa các dữ liệu này gồm định dạng, cách phát âm, và mã nguồn ký tự. Như ông Feng Zheng, chuyên gia về ngôn ngữ Trung Quốc tại một trường đại học ở Bắc Kinh gặp phải khó khăn bởi thiếu nguồn ký tự được số hóa.
Theo ông, trong 1.000 ký tự tiếng Hoa trong một cuốn sách cổ thì có một ký tự hiếm mà mã ký tự 2-byte không xử lý được, có nghĩa là nhiều sách cổ không có được phiên bản số để phục vụ các nhà nghiên cứu.
Mã 4-byte và cơ sở dữ liệu được sắp xếp là đề tài cho 20 phát minh ứng dụng và đã được đưa vào thử nghiệm trong hơn 100 trường đại học Trung Quốc và nước ngoài. Về lâu dài, cơ sở dữ liệu sẽ được sử dụng để lập số hóa các cuốn sách về chữ viết trong lịch sử cho trường tiểu học và trung học Trung Quốc.
Hiện nay có khoảng 1,5 tỷ người sử dụng tiếng Trung. Trên thế giới, số lượng người học tiếng Trung như một ngoại ngữ ước tính là 30 triệu người.
(Tân Hoa xã)
|