TCVN về quản lý tài liệu - Định dạng tệp tài liệu điện tử cho bảo quản lâu dài
05/06/2025
5 Lượt xem
Để đảm bảo việc lưu trữ, khai thác và sử dụng thông tin một cách hiệu quả, an toàn và đúng quy định, việc quản lý tài liệu điện tử nhằm bảo quản lâu dài cần tuân thủ theo Tiêu chuẩn quốc gia TCVN 14159-1:2024 và TCVN 14159-1:2024.
PDF là một định dạng tệp kỹ thuật số dùng để trình bày tài liệu sao cho giống như tài liệu giấy. Các tệp PDF có thể được tạo ra từ tài liệu gốc trên máy tính, chuyển đổi từ các định dạng khác, hoặc được số hóa từ tài liệu giấy, phim vi ảnh hoặc bản cứng khác. Hiện nay, các cơ quan chính phủ, doanh nghiệp, thư viện, cơ quan lưu trữ và cá nhân trên toàn thế giới đều sử dụng PDF để lưu giữ những thông tin quan trọng.
Nhiều tài liệu dưới dạng PDF cần được lưu giữ trong thời gian dài, thậm chí là vĩnh viễn. Vì vậy, những tệp này phải đảm bảo vẫn có thể mở, xem và sử dụng được dù công nghệ có thay đổi theo thời gian. Để làm được điều đó, PDF cần giữ nguyên được bố cục nội dung, thứ tự đọc tự nhiên, cấu trúc rõ ràng giữa các phần, dòng và trang tài liệu. Ngoài ra, còn cần hỗ trợ quản lý thông tin, mô tả tài liệu bằng siêu dữ liệu và các yếu tố kỹ thuật khác.
Tuy nhiên, vì PDF có rất nhiều tính năng phức tạp, nên khi dùng để lưu trữ lâu dài, cần phải giới hạn một số tính năng để đảm bảo tài liệu được bảo quản tốt. Do đó, việc lưu trữ tài liệu điện tử nên tuân theo bộ Tiêu chuẩn quốc gia TCVN 14159-1:2024, còn gọi là PDF/A-1 – phiên bản PDF được thiết kế riêng cho mục đích lưu trữ lâu dài và TCVN 14159-2:2024 sử dụng ISO 32000-1. Tiêu chuẩn này áp dụng cho các tài liệu có chứa văn bản, hình ảnh dạng lưới (như bảng biểu) và hình vẽ dạng vector.
Bảo quản lâu dài tài liệu điện tử sử dụng định dạng PDF theo tiêu chuẩn giúp đảm bảo tài liệu không bị mất mát, hư hỏng hay thất lạc theo thời gian. Ảnh minh họa
Tiêu chuẩn này không áp dụng cho cách thức cụ thể để chuyển đổi tài liệu giấy hoặc điện tử sang PDF/A. Cách thiết kế phần mềm, giao diện người dùng hoặc các bước kỹ thuật chi tiết khi tạo ra file PDF/A. Hình thức lưu trữ vật lý như lưu vào USB, đĩa cứng, hay điều kiện bảo quản tài liệu. Yêu cầu về phần cứng hoặc hệ điều hành.
Về yêu cầu chung đối với tệp PDF/A-1, một tệp PDF được coi là phù hợp với tiêu chuẩn PDF/A-1 nếu nó tuân thủ tất cả các quy định kỹ thuật nêu trong tiêu chuẩn. Các tệp này có thể sử dụng mọi tính năng hợp lệ của định dạng PDF (phiên bản trước 1.4), miễn là những tính năng đó không bị cấm hoặc không mơ hồ theo quy định.
Nếu tệp sử dụng các phần mở rộng (một dạng mở rộng tính năng), thì các mô tả về phần mở rộng này phải được nhúng trực tiếp trong tệp dưới dạng siêu dữ liệu theo yêu cầu của tiêu chuẩn. Tất cả các lược đồ mở rộng được sử dụng trong một tệp phù hợp phải có các mô tả nhúng trong tệp đó trong dòng siêu dữ liệu được quy định. Các mô tả này phải quy định sử dụng lược đồ vùng chứa lược đồ mở rộng PDF/A quy định.
Ngoài PDF/A-1, tiêu chuẩn còn hỗ trợ định dạng PDF/A-2, vốn được xây dựng dựa trên quy định mới hơn đó là ISO 32000-1. Khi sử dụng định dạng này, các tệp PDF phải tuân thủ các yêu cầu trong ISO 32000-1, trừ những phần bị sửa đổi bởi tiêu chuẩn hiện hành.
Ngoài ra tiêu chuẩn này cũng đưa ra việc sử dụng ISO 32000-1 để bảo quản lâu dài dạng trình bày trực quan tĩnh của tài liệu điện tử dưới dạng trang. Theo đó các tệp PDF/A-2 phù hợp phải tuân theo tất cả các yêu cầu của ISO 32000-1 như được sửa đổi trong tiêu chuẩn này.
Lưu ý không nên dùng các tính năng cũ của PDF (trước phiên bản 1.7) nếu chúng không được nêu rõ trong ISO 32000-1. Tệp phù hợp không cần phải sử dụng tất cả các tính năng của PDF, chỉ cần những gì được quy định bắt buộc.
Khi kiểm tra tệp theo tiêu chuẩn PDF/A-2 (dựa trên ISO 32000-1), cần có cách xác định xem trong một trang PDF có sử dụng các hiệu ứng trong suốt hay không. Nếu có, phần mềm đọc PDF phải biết cách kiểm tra xem phông chữ nào đang được sử dụng và hiệu ứng đồ họa nào được áp dụng.