11 มี.ค. 2019 เวลา 07:01 • วิทยาศาสตร์ & เทคโนโลยี
การประเมิน Digital integrity ของคลังข้อมูลดิจิทัล
Data integrity เป็นหนึ่งในเกณฑ์ที่หลายหน่วยงานที่ทำหน้าที่ประเมินและส่งเสริมความน่าเชื่อถือและความยั่งยืนของคลังข้อมูลดิจิทัลใช้ในการประเมินคลังข้อมูลดิจิทัลที่เชื่อถือได้
Data integrity คืออะไร และตัวอย่างการประเมิน Data integrity ของคลังข้อมูลดิจิทัล
หน่วยงานที่ทำหน้าที่ในทำหน้าที่ประเมินและส่งเสริมเกี่ยวกับความน่าเชื่อถือและความยั่งยืนของคลังข้อมูลดิจิทัล เช่น Digital Curation Centre และ CoreTrustSeal ซึ่งเกิดจากความร่วมมือระหว่าง Data Seal of Approval (DSA) และ the ICSU World Data System (WDS) กำหนดให้ Data integrity เป็นเกณฑ์หนึ่งที่ใช้ในการประเมินความน่าเชื่อถือและความยั่งยืนของคลังข้อมูลดิจิทัล
Data integrity หรือ ความถูกต้องสมบูรณ์ของข้อมูล คือ การรักษาความถูกต้องของข้อมูล ความสามารถที่จะตรวจสอบได้ว่าข้อมูลที่ได้รับมีความถูกต้อง ครบถ้วนสมบูรณ์ และไม่ถูกเปลี่ยนแปลงแก้ไขใดๆ ไปจากเดิม โดยผู้ที่ไม่ได้รับอนุญาต หากมีการเปลี่ยนแปลงโดยผู้ได้รับอนุญาต จะต้องมีการบันทึกทุกการเปลี่ยนแปลง เพื่อการตรวจสอบกลับการเปลี่ยนแปลงนั้น
Digital Curation Centre ได้กำหนดเกณฑ์เกี่ยวกับการประเมิน Data integrity ไว้ 3 ประเด็น คือ
- ไฟล์ที่จัดเก็บในคลังข้อมูลถูกทำการสำรองและไฟล์สำเนาแต่ละไฟล์จะต้องมีลายนิ้วมือดิจิทอล (digital fingerprint) หรือ checksum ซึ่งหมายถึง ตัวเลขที่แสดงถึงผลรวมของตัวเลขทั้งหมดในข้อมูลดิจิทัลที่ถูกเก็บไว้หรือส่งผ่าน ซึ่งการเปรียบเทียบตัวเลขนี้ในภายหลังช่วยในการตรวจสอบความถูกต้องและสมบูรณ์ของข้อมูล
- ทำการตรวจสอบความถูกต้องของข้อมูลตามช่วงเวลาที่กำหนด ตรวจสอบความเสียหายของไฟล์ และมีบันทึกการตรวจสอบ
- ทำการตรวจสอบความถูกต้องของข้อมูลเพื่อตอบสนองต่อเหตุการณ์ที่เฉพาะเจาะจงต่างๆ ที่เกิดขึ้น ซ่อมแซมข้อมูลที่เสียหาย และตรวจสอบให้แน่ใจว่าไม่มีใครมีสิทธิ์การเข้าถึงเพื่อทำการแก้ไขเปลี่ยนแปลงสำเนาทั้งหมดของข้อมูล
CoreTrustSeal ระบุเรื่อง Data integrity ใน การจัดการวัตถุดิจิทัล (Digital Object Management) ในหัวข้อย่อยที่ 7 ความถูกต้องและและความน่าเชื่อถือได้ของข้อมูล (VII. Data integrity and authenticity) ใน R7. คลังข้อมูลรับประกันความถูกต้องและความน่าเชื่อถือได้รวมถึงความสอดคล้อง (กับต้นฉบับ) ของข้อมูล (R7. The repository guarantees the integrity and authenticity of the data)
CoreTrustSeal เสนอว่า ความถูกต้อง (Integrity) คือ การตรวจสอบให้แน่ใจว่าการเปลี่ยนแปลงข้อมูลและเมทาดาทาถูกบันทึกไว้และสามารถติดตามเหตุผลและผู้ที่ทำการเปลี่ยนแปลงได้
โดยการประเมินเรื่อง ความถูกต้องของข้อมูลของ CoreTrustSeal จะพิจารณาหลักฐานเกี่ยวกับ
- คำอธิบายของการตรวจสอบเพื่อตรวจสอบว่าวัตถุดิจิทัลไม่ถูกเปลี่ยนแปลงหรือทำให้เสียหาย (เช่น การตรวจสอบการแก้ไข)
- เอกสารเกี่ยวกับความครบถ้วนสมบูรณ์ของข้อมูลและเมทาดาทา
- รายละเอียดของการเปลี่ยนแปลงของข้อมูลและเมทาดาทาทั้งหมดที่บันทึกไว้
- คำอธิบายของกลยุทธ์การควบคุมเวอร์ชันของข้อมูล
- การใช้มาตรฐานสากลและอนุสัญญาระหว่างประเทศที่เหมาะสม
USGS Fundamental Science Practices Advisory Council/National Digital Stewardship Alliance ได้จัดระดับการประเมินความน่าเชื่อถือและความยั่งยืนของคลังดิจิทัลไว้ 4 ระดับ จากระดับต่ำไประดับสูง คือ จากระดับ 1 ไป ระดับ 4โดยการประเมินเรื่องความถูกต้องของข้อมูล ได้กำหนดเงื่อนไขภายใต้แต่ละระดับ ดังนี้
ระดับ 1
- ตรวจสอบ checksums ในการนำเข้าข้อมูลทั้งหมด
ระดับ 2
- ตรวจสอบ checksums ในการนำเข้าข้อมูลทั้งหมด
- ใช้กระบวนการแบบอ่านอย่างเดียวเมื่อทำงานกับสื่อต้นฉบับ
ระดับ 3
- ตรวจสอบ checksums ตามช่วงเวลาที่กำหนด– ดูแล logs ของ checksums และจัดหาข้อมูลการตรวจสอบตามความต้องการ
- รักษากระบวนการการตรวจหาข้อมูลที่เสียหาย
- ตรวจสอบไวรัสในเนื้อหาทั้งหมด
ระดับ 4
- ตรวจสอบ checksums ของเนื้อหาทั้งหมดเพื่อตอบสนองต่อเหตุการณ์หรือกิจกรรมเฉพาะ
- รักษากระบวนการการเปลี่ยนหรือซ่อมแซมข้อมูลที่เสียหาย
- ตรวจสอบให้แน่ใจว่าไม่มีใครมีสิทธิ์การเข้าถึงเพื่อทำการแก้ไขเปลี่ยนแปลงสำเนาทั้งหมดของข้อมูล
- สร้าง จัดเก็บและตรวจสอบ checksums ที่แตกต่างกันสำหรับเนื้อหาทั้งหมด
แหล่งที่มาข้อมูล
CoreTrustSeal. CoreTrustSeal data repositories requirements. Retrieve from https://www.coretrustseal.org/why-certification/requirements/
Faundeen, J. (2017). Developing criteria to establish trusted digital repositories. Data Science Journal, (16, 22), pp. 1–13, DOI: https://doi.org/10.5334/dsj-2017-022
โฆษณา