บทที่3ฐานข้อมูล และคลังข้อมูล




ฐานข้อมูล และคลังข้อมูล







มีรูปแบบเป็นลำดับชั้นโดยเริ่มด้วยหน่วยที่เล็กที่สุด คือ บิต(Bit) ไบต์(Byte) เขตข้อมูล(Field) ระเบียนข้อมูล(Record) และไฟล์(File) ตามลำดับ

· บิต (Bit) เป็นหน่วยที่เล็กที่สุดของข้อมูลที่จัดเก็บในระบบคอมพิวเตอร์ เป็นเลขฐาน สอง 0 กับ 1
· ไบต์ (Byte)
ประกอบด้วยบิตหลาย ๆ บิตมาเรียงต่อกัน 8 บิต มาเรียงต่อกันเป็น 1 ไบท์ สร้างรหัสแทนข้อมูลใช้แทนอักขระ เป็นตัวเลข ตัวอักษร สัญลักษณ์ ได้ทั้งหมด 28 = 256 ตัว
· เขตข้อมูล (Field) เป็นการนำข้อมูลหลายอักขระมารวมกันเป็นคำให้เกิดความหมาย
· ระเบียนข้อมูล (Record)
กลุ่มของเขตข้อมูลที่มีความสัมพันธ์กัน นำมารวมกัน
· ไฟล์ (File) คือ กลุ่มของระเบียนข้อมูลที่มีความสัมพันธ์กันนำมาจัดเก็บไว้ด้วยกัน

ปัญหาเกี่ยวกับแฟ้มข้อมูล


1. ความซ้ำซ้อนของข้อมูล (Data Redundancy) การเก็บข้อมูลมากกว่าหนึ่งแห่ง ทำให้ยากต่อการควบคุมความถูกต้องให้ตรงกันของข้อมูล

2. ความผูกพันระหว่างข้อมูลและโปรแกรม (Program-Data Dependence) เป็นความผูกพันระหว่างข้อมูลและโปรแกรม โดยการเรียกใช้ข้อมูลต้องมีโปรแกรม หากเปลี่ยนแปลงข้อมูล หรือโครงสร้าง จะมีผลกระทบต่อโปรแกรม ทำให้ต้องตามแก้โปรแกรมที่เกี่ยวข้อง ซึ่งทำให้เกิดค่าใช้จ่ายสูงในการบำรุงรักษาโปรแกรม

3. การไม่สามารถใช้ข้อมูลร่วมกันได้ (Lack of Data sharing) มีการจัดเก็บข้อมูลแยกจากกันทำให้ความพร้อมการใช้ข้อมูลยาก ไม่สามารถนำข้อมูลจากหลายแฟ้มมาใช้งานร่วมกันได

4. การขาดความร่วมมือ (Lack of Flexibility) ระบบแฟ้มข้อมูลขาดความคล่องตัวในการตอบสนองต่อความต้องการใหม่ ๆ

5. การขาดระบบรักษาความปลอดภัยที่ดี (Poor Security) การป้องกันไม่ให้ผู้ที่ไม่มีสิทธิเข้าถึงข้อมูลและใช้ข้อมูล มีขอบเขตความสามารถจำกัด

แนวทางในการใช้ฐานข้อมูลในการบริหารจัดการข้อมูล



ลดความซ้ำซ้อนของข้อมูล (Minimum Redundancy) การนำข้อมูลมารวมกันเพื่อตัดข้อมูลที่ซ้ำกันออกไป ระบบฐานข้อมูลมี DBMS เป็นซอฟต์แวร์ที่ดูแลจัดการข้อมูลทำให้ควบคุมการเกิดความซ้ำซ้อนของข้อมูลได้
มีความเป็นอิสระต่อกัน (Data Independence) ระบบฐานข้อมูลมีแหล่งรวมข้อมูลเก็บข้อมูลต่างๆ ไว้ส่วนกลาง มี DBMS ดูแลการปรับเปลี่ยนโครงสร้างของข้อมูล
สนับสนุนการใช้ข้อมูลร่วมกัน (Improved Data Sharing) การจัดเก็บข้อมูลไว้ส่วนกลางช่วยให้สามารถใช้ข้อมูลร่วมกันได้ โปรแกรมประยุกต์สามารถใช้ข้อมูลที่มีอยู่แล้วโดยไม่ต้องเพิ่มข้อมูลเข้าไปในระบบอีก
มีความคล่องตัวในการใช้งาน (Improved Flexibility) การรวบรวมข้อมูลไว้ที่เดียวกัน มีการควบคุมอยู่ส่วนกลางช่วยให้มีความคล่องตัวในการใช้งานได้มากกว่าระบบไฟล์ข้อมูล DBMS มีเครื่องมือช่วยในการสร้างแบบฟอร์มและรายงานต่าง ๆ ลดขั้นตอน และเวลาในการจัดทำรายงานและการเขียนโปรแกรมได้มาก
มีระบบรักษาความปลอดภัยของข้อมูลสูง (High Degree of Data Integrity) ฐานข้อมูลมีระบบรักษาความปลอดภัย โดย DBMS จะตรวจสอบรหัสผ่านเข้าสู่ระบบ และอนุญาตผู้มีสิทธิเข้ามาในระบบได้เฉพาะสิทธิแต่ละคนเท่านั้น

ระบบจัดการฐานข้อมูล ( Database Management System) หรือที่เรียกว่า ดีบีเอ็มเอส (DBMS) 
คือซอฟต์แวร์สำหรับบริหารและจัดการฐานข้อมูล เปรียบเสมือนสื่อกลางระหว่างผู้ใช้และโปรแกรมต่างๆ ที่เกี่ยวข้องกับการใช้ฐานข้อมูล ซึ่งมีหน้าที่ช่วยให้ผู้ใช้เข้าถึงข้อมูลได้ง่ายสะดวกและมีประสิทธิภาพ การเข้าถึงข้อมูลของผู้ใช้ อาจเป็นการสร้างฐานข้อมูล การแก้ไขฐานข้อมูล หรือการตั้งคำถามเพื่อให้ได้ข้อมูลมาโดยผู้ใช้ไม่จำเป็นต้องรับรู้เกี่ยวกับรายละเอียดภายในโครงสร้างของฐานข้อมูล เปรียบเสมือนเป็นสื่อกลางระหว่างผู้ใช้และโปรแกรมต่าง ๆ ที่เกี่ยวข้องกับการใช้ฐานข้อมูลซึ่งต่างจากระบบแฟ้มข้อมูลที่หน้าที่เหล่านี้จะเป็นหน้าที่ของโปรแกรมเมอร์


รูปแบบของฐานข้อมูล


ฐานข้อมูลแบบลําดับขั้น (Hierarchical Database)

เป็นฐานข้อมูลที่นําเสนอข้อมูลและความสัมพันธ์ระหว่างข้อมูลในรูปแบบของโครงสร้างต้นไม้ (Tree Structure) เป็นโครงสร้างลักษณะคล้ายต้นไม้เป็นลําดับขั้น ซึ่งแตกออกเป็นกิ่งก้านสาขา ผู้ที่คิดค้นฐานข้อมูลแบบนี้คือ North American Rockwell




ฐานข้อมูลแบบเครือข่าย (Network Database)

โครงสร้างของข้อมูลแต่ละแฟ้มข้อมูลมีความสัมพันธ์คล้ายร่างแห โดยมีลักษณะโครงสร้างคล้ายกับโครงสร้างแบบลําดับขั้น แตกต่างกันตรงที่โครงสร้างแบบเครือข่ายสามารถมีต้นกําเนิดของข้อมูลได้มากกว่า 1 เรคอร์ด การออกแบบลักษณะของฐานข้อมูลแบบเครือข่ายทําให้สะดวกในการค้นหามากกว่าลักษณะฐานข้อมูลแบบลําดับขั้น เพราะไม่ต้องไปเริ่มค้นหาตั้งแต่ข้อมูลต้นกําเนิดโดยทางเดียว ข้อมูลแต่ละกลุ่มจะเชื่อมโยงกันโดยตัวชี้





ฐานข้อมูลแบบเชิงสัมพันธ์ (Relational Database)

ฐานข้อมูลแบบเชิงสัมพันธ์ประกอบด้วยกลุ่มของเอนทิตี้ที่มีความสัมพันธ์กัน โดยข้อมูลของแต่ละเอนทิตี้จะถูกจัดเก็บข้อมูลในรูปแบบของตาราง 2 มิติในแนวแถว (Row) และแนวคอลัมน์(Column) โดยบรรทัดแรกของตารางคือ ชื่อแอททริบิวต์








Data Mining (เหมืองข้อมูล ) 

คือกระบวนการที่กระทำกับข้อมูลจำนวนมากเพื่อค้นหารูปแบบและความสัมพันธ์ที่ซ่อนอยู่ในชุดข้อมูลนั้น ในปัจจุบันการทำเหมืองข้อมูลได้ถูกนำไปประยุกต์ใช้ในงานหลายประเภท ทั้งในด้านธุรกิจที่ช่วยในการตัดสินใจของผู้บริหาร ในด้านวิทยาศาสตร์และการแพทย์รวมทั้งในด้านเศรษฐกิจและสังคม

การทำเหมืองข้อมูล (Data Mining) เปรียบเสมือนวิวัฒนาการหนึ่งในการจัดเก็บและตีความหมายข้อมูล จากเดิมที่มีการจัดเก็บข้อมูลอย่างง่ายๆ มาสู่การจัดเก็บในรูปแบบฐานข้อมูลที่สามารถดึงข้อมูลสารสนเทศมาใช้จนถึงการทำเหมืองข้อมูลที่สามารถค้นพบความรู้ที่ซ่อนอยู่ในข้อมูล หรือจะแยกๆ เป็นข้อๆ ได้ดังนี้

– กระบวนการหรือการเรียงลำดับของการค้นข้อมูลจำนวนมากและเก็บข้อมูลที่เกี่ยวข้อง

– การนำมาใช้โดยหน่วยงานทางธุรกิจและนักวิเคราะห์ทางการเงินหรือการนำมาใช้งานในด้านวิทยาศาสตร์เพื่อเอาข้อมูลขนาดใหญ่ที่สร้างโดยวิธีการทดลองและการสังเกตการณ์ที่ทันสมัย

– การสกัดหรือแยกข้อมูลที่เป็นประโยชน์จากข้อมูลขนาดใหญ่หรือฐานข้อมูล

– การวางแผนทรัพยากรขององค์กรโดยสามารถวิเคราะห์ทางสถิติและตรรกะของข้อมูลขนาดใหญ่เป็นการมองหารูปแบบที่สามารถช่วยการตัดสินใจได้







แหล่งที่มา
https://pimpanp.wordpress.com/2008/04/26/%E0%B8%9A%E0%B8%97%E0%B8%97%E0%B8%B5%E0%B9%88-3-%E0%B8%90%E0%B8%B2%E0%B8%99%E0%B8%82%E0%B9%89%E0%B8%AD%E0%B8%A1%E0%B8%B9%E0%B8%A5-%E0%B9%81%E0%B8%A5%E0%B8%B0%E0%B8%84%E0%B8%A5%E0%B8%B1%E0%B8%87/
http://www.pongkorn.net/?article:194
https://sites.google.com/site/nganklumthankhxmul/rup-baeb-khxng-than-khxmul
http://www.glurgeek.com/education/data-mining-%E0%B8%84%E0%B8%B7%E0%B8%AD%E0%B8%AD%E0%B8%B0%E0%B9%84%E0%B8%A3-%E0%B8%AD%E0%B8%A2%E0%B8%B2%E0%B8%81%E0%B8%A3%E0%B8%B9%E0%B9%89%E0%B8%95%E0%B9%89%E0%B8%AD%E0%B8%87%E0%B8%AD%E0%B9%88/


ความคิดเห็น

บทความที่ได้รับความนิยม