Tin Khoa học - Công nghệ trong nước

BIOKEYS - phần mềm tạo, sử dụng khóa đa truy để tra cứu/ định loại động thực vật ở các bậc phân loại và minh họa kết quả bằng cơ sở dữ liệu

.

Từ trước tới nay khóa lưỡng phân là lựa chọn phổ biến để phân định loại động thực vật ở các bậc phân loại khác nhau. Tuy nhiên, khóa lưỡng phân có một yếu điểm: để bắt đầu phân loại, ít nhất mẫu đó phải chứa đặc điểm đầu tiên của khóa lưỡng phân được sử dụng. Mặc dù các nhà phân loại học đã xây dựng khóa bắt đầu bằng những đặc điểm hình thái thường gặp nhưng vấn đề nêu trên vẫn chưa được giải quyết dứt điểm, vì vẫn có thể xảy ra trường hợp, các đặc điểm ở bậc thứ 2, 3 trong khóa lại là những đặc điểm hiếm gặp.

Khóa đa truy là một loại khóa phân loại, trong đó người ta có thể bắt đầu bằng bất cứ đặc điểm nào của khóa. Hệ thống các đục lỗ dùng cho phân loại các họ thực vật hạt kín thế giới của Bertel Hansen và Knud Rahn (1969) là một ví dụ cho loại khóa này. Tuy nhiên, tạo khóa đa truy dạng các đục lỗ đòi hỏi nhiều công việc phức tạp, khóa dạng này lại không thuận lợi cho người sử dụng. Một ví dụ nữa có thể kể đến là khóa đa truy dạng bảng dùng phân loại các họ thực vật hạt kín Việt Nam của Nguyễn Tiến Bân (1997). Tuy nhiên, sử dụng khóa dạng bảng cũng không hề đơn giản.

Để có thể sử dụng hết các tính năng của khóa đa truy, Viện Sinh thái và tài nguyên sinh vật, Viện Hàn lâm Khoa học và Công nghệ Việt Nam đã thiết lập Phần mềm BIOKEYS. Đây là một hệ thống cho phép người sử dụng: (1) tạo ra cơ sở dữ liệu sinh vật của mình; (2) tạo ra khóa đa truy của mình, sử dụng khóa đa truy để tra cứu/ định loại và dùng dữ liệu trong cơ sở dữ liệu để minh họa kết quả định loại cho các taxon khác nhau; (3) đánh giá khóa đa truy thông qua một số chỉ tiêu thống kê.

Việc tạo khóa đa truy trong BIOKEYS giống như việc soạn thảo văn bản, biến việc tạo khóa trở nên đơn giản hơn. Khuôn thức tệp khóa gồm dòng đầu và các dòng thân. Dòng đầu chứa tên cấp taxon và tên nhóm sinh vật có thể định loại bằng khóa (hình 1). Hai tên đó được để trong ngoặc vuông và được nối với nhau bởi từ OF (tiếng Anh). Mỗi dòng thân chứa tên taxon và các đặc điểm của taxon đó. Tên taxon được để ở đầu dòng, tiếp theo là dấu bằng, mỗi đặc điểm sau đó đều được đặt giữa hai cặp gạch chéo ngược.

Khóa đa truy hoàn thiện có thể được dùng vào việc định loại mẫu sinh vật hoặc tra cứu cơ sở dữ liệu. Trong hộp thoại “Tra cứu/ định loại” của BIOKEYS, sau khi mở tệp khóa đa truy, toàn bộ các đặc điểm của khóa được liệt kê ở danh sách trên (hình 2). Để định loại mẫu hoặc tra cứu, người sử dụng chọn những đặc điểm cần thiết và chuyển xuống danh sách dưới. Sau khi hoàn tất việc chọn đặc điểm, kích chuột vào nút thực hiện, BIOKEYS sẽ hiển thị tất cả các bản ghi của các taxon phù hợp có trong cơ sở dữ liệu lên màn hình dưới dạng web (hình 3). Khi tra cứu không cần có mẫu, ví dụ nếu ta muốn biết những taxon nào có đặc điểm “không lá”, ấn chọn và đưa đặc điểm này xuống danh sách dưới của hộp thoại tra cứu/ định loại, sau đó kích chuột vào nút “Thực hiện”, BIOKEYS sẽ tìm trong cơ sở dữ liệu các taxon có đặc điểm này và hiển thị dưới dạng web. Cách hiển thị dưới dạng web cho phép người sử dụng truy cập đến ảnh hoặc tệp mô tả cần quan tâm (bằng cách kích chuột lên các kết nối của web).

Ngoài phương án sử dụng cửa sổ soạn thảo, việc sửa khóa đa truy cũng rất thuận tiện với hộp thoại “Tạo/ Sửa tệp khóa”. Trong hộp thoại này, sau khi mở một tệp khóa đa truy, người sử dụng có thể thêm /bớt một hay nhiều đặc điểm cho một hay nhiều taxon. Một khung trống với các taxon giống như khóa đang mở được tạo ra tự động, sau đó người sử dụng có thể chỉnh sửa và xây dựng khóa mới.

khoadatruy
Hình 1: Khóa đa truy trong cửa sổ soạn thảo

khoadatruy1

Hình 2: Hộp thoại tra cứu/ định loại

khoadatruy2

Hình 3: Kết quả định loại với các đặc điểm đã chọn như trên hình 2

Việc phân tích khóa đa truy được thực hiện thông qua hộp thoại “Phân tích khóa”. Các chỉ tiêu thống kê giúp người dùng có thể đánh giá khóa đa truy như:

- Số đặc điểm của mỗi taxon trong khóa.
- Số taxon có chứa một đặc điểm nhất định.
- Với mỗi kích thước tổ hợp đặc điểm: có thể có tổng số bao nhiêu tổ hợp đặc điểm, mỗi đặc điểm có thể tham gia định loại thành công cho bao nhiêu taxon, mỗi taxon có thể được định loại thành công bởi bao nhiêu tổ hợp.

Trong số các chỉ tiêu này, nhóm chỉ tiêu 3 (là kết quả phân tích tổ hợp đặc điểm) đòi hỏi năng lực tính toán lớn, đặc biệt là khi kích thước khóa lớn (nhiều taxon và nhiều đặc điểm), vì vậy khi thực hiện phân tích tổ hợp đặc điểm nên sử dụng máy có công suất cao để không phải chờ kết quả quá lâu.

BIOKEYS là một hệ thống cung cấp đầy đủ các tính năng cho việc tạo, sử dụng khóa đa truy để tra cứu/ định loại động thực vật ở các bậc phân loại và minh họa kết quả bằng cơ sở dữ liệu. Mặc dù khóa đa truy có nhiều ưu điểm, tuy nhiên cho đến nay khóa đa truy vẫn chưa được sử dụng phổ biến. Đó là do chưa có các công cụ để tạo và sử dụng khóa đa truy một cách thuận tiện. Với phần mềm BIOKEYS việc tạo và sử dụng khóa đa truy trở nên rất dễ dàng, nhanh chóng, đây có thể coi là một sự chuyển biến đáng kể trong tập quán tạo và sử dụng khóa của các nhà phân loại.

Nguồn tin: PGS.TS. Nguyễn Văn Sinh
Viện Sinh thái và tài nguyên sinh vật

Xử lý tin: Mai Lan

Bản quyền thuộc về Viện Hàn lâm Khoa học và Công nghệ Việt Nam.
Địa chỉ: 18 Hoàng Quốc Việt, Cầu Giấy, Hà Nội. Email: This email address is being protected from spambots. You need JavaScript enabled to view it.
Khi phát hành lại thông tin trên Website cần ghi rõ nguồn: "Viện Hàn lâm Khoa học và Công nghệ Việt Nam".