Bỏ qua nội dung chính
 

 

SỐ LƯỢT TRUY CẬP

4
2
3
3
8
0
5
1
Văn phòng cấp ủy 27 Tháng Mười 2023 4:00:00 CH

Yêu cầu về định từ khóa cho các cơ sở dữ liệu tài liệu Kho lưu trữ Trung ương Đảng

 

Định từ khóa là việc cần thiết khi xây dựng các cơ sở dữ liệu trong mỗi hệ thống thông tin tư liệu. Ngày 25/6/1999, Cục Lưu trữ Văn phòng Trung ương Đảng đã ban hành Hướng dẫn số 01-HD/LT về việc định từ khóa cho các cơ sở dữ liệu tài liệu Kho Lưu trữ Trung ương Đảng, trong đó cụ thể:

1. Yêu cầu chung đối với định từ khóa: 

Việc sử dụng ngôn ngữ từ khóa trong các cơ sở dữ liệu nhằm mục đích
cơ bản là mô tả nội dung tài liệu; tìm tài liệu theo nội dung.

Việc định từ khóa phải bám sát 02 mục đích đó. Trên thực tế việc mô tả nội dung tài liệu do người xử lý tài liệu đảm nhiệm, mục đích thứ hai (tìm tài liệu theo nội dung) do người dùng tin đảm nhiệm. Vì vậy, từ khóa phải là ngôn ngữ chung giữa 02 nhóm người này. Để trở thành ngôn ngữ chung có hiệu quả, từ khóa phải đạt yêu cầu sau: Đúng đắn về nội dung, thống nhất về hình thức.

Người xử lý từ khóa (định từ khóa) phải đạt được những yêu cầu sau:
Hiểu biết về lịch sử của Đảng qua từng thời kỳ, chức năng, nhiệm vụ của các tổ chức Đảng, các chủ trương, chính sách của Đảng, hiểu biết về quá trình hình thành tài liệu và các thể loại tài liệu do kho lưu trữ Trung ương quản lý. Hiểu biết về từ vựng tiếng Việt và thuật ngữ học nói chung. Nắm vững phương pháp luận xử lý từ khóa. Có kinh nghiệm mô tả tài liệu và tìm tin bằng từ khóa.

2. Yêu cầu cụ thể về định từ khóa:

Về nội dung, từ khóa phải đảm bảo khả năng mô tả khái niệm như một thuật ngữ khoa học, tức là phải đảm bảo các yêu cầu sau:

Tính đúng đắn về mặt ngôn ngữ khoa học được hiểu là sự phù hợp với những ước định về từ vựng và thành ngữ khoa học trong tiếng Việt. Sử dụng các thuật ngữ phổ thông quen dùng là chính, không dùng các khẩu ngữ, không dùng các từ địa phương: không dùng “Võ trang” mà dùng “Vũ trang”, không dùng “Chánh quyền” mà dùng “Chính quyền”, không sử dụng nghĩa bóng của từ như “cách mạng xanh”, vàng đen, …

Tính súc tích được hiểu là sự hàm chứa một nội dung thông tin trong một hình thức diễn đạt ngắn gọn nhất. Để đảm bảo tính súc tích của từ khóa cần áp dụng biện pháp gọi là nén từ, nghĩa là có thể biến đổi một từ khóa thành một dạng đơn giản hơn. Giản lược các từ thể hiện số nhiều “những”, “các”, “một số”; từ chỉ sự danh từ hóa “sự”; từ phụ trợ như “của”, “được”, “cho”; từ không làm rõ thêm ý nghĩa của từ chính trong những trường hợp cụ thể: không dùng “hiện tượng tiêu cực” - mà cùng “tiêu cực”; giản lược các từ đệm, láy nếu có thể được.

Tính ngắn gọn để tạo khả năng kết hợp linh hoạt và tối ưu trong quá trình tìm tin; được đảm bảo bằng cách phân chia, cụm từ có cấu trúc phức tạp hoặc thể hiện những khái niệm phức tạp ra thành những từ hoặc cụm từ đơn giản hơn nêu có thể. Trong trường hợp các cụm từ phức tạp khi định từ khóa cần phải phân tích chúng ra thành những từ đơn giản đủ nghĩa. Khi phân tích các cụm từ phức tạp theo cấu trúc cú pháp cần dựa trên cơ sở xác định cấu trúc cú pháp của chúng thành hai (hoặc nhiều) phần nhỏ hơn theo cấu trúc đó. Khi phân tích các cụm từ phức tạp theo cấu trúc ngữ nghĩa thì cần dựa trên cơ sở xác định ngữ nghĩa của các cụm từ đó và tách chúng thành những từ hoặc cụm từ đơn giản hơn theo ngữ nghĩa đó.

Tính chính xác và hiện đại: Chuẩn hóa theo tiêu chuẩn Việt về từ vựng và thuật ngữ khoa học - xã hội; chuẩn hóa theo từ điển; tính thực tiễn (phổ dụng) của từ khóa, không dùng những thuật ngữ đã lỗi thời.

Tính đơn nghĩa: Là tương ứng với một khái niệm chỉ có một thuật ngữ duy nhất. Đây là yêu cầu lý tưởng trong ngôn ngữ từ khóa. Song trên thực tế, không thể đáp ứng yêu cầu này một cách tuyệt đối, do hiện tượng đồng âm đa nghĩa và đồng nghĩa đa âm gây ảnh hưởng đến ngôn ngữ từ khóa.


Số lượt người xem: 2055    

TIN MỚI HƠN

TIN ĐÃ ĐƯA