พลังของ MarkLogic: การจัดการข้อมูลขนาดใหญ่และความปลอดภัยในที่เดียว

เผยแพร่แล้ว: 2023-01-29

MarkLogic เป็นฐานข้อมูล Nosql อันทรงพลังที่ช่วยให้องค์กรสามารถจัดเก็บ จัดการ และค้นหาข้อมูลจำนวนมากได้อย่างง่ายดายและรวดเร็ว สามารถปรับขนาดได้สูงและให้ประสิทธิภาพสูง จึงเหมาะสำหรับการใช้งานข้อมูลขนาดใหญ่ นอกจากนี้ MarkLogic ยังมีคุณสมบัติด้านความปลอดภัยในตัวที่ปกป้องข้อมูลจากการเข้าถึงโดยไม่ได้รับอนุญาตและรับประกันความสมบูรณ์ของข้อมูล

เพื่อตอบสนองความต้องการวิธีที่ยืดหยุ่นและมีประสิทธิภาพมากขึ้นในการจัดเก็บข้อมูลจำนวนมาก การเคลื่อนไหวที่เรียกว่า NoSQL จึงถือกำเนิดขึ้น โพสต์นี้มีวัตถุประสงค์เพื่อเป็นไพรเมอร์ทั่วไปสำหรับทุกคนที่สนใจในสาขาที่เกิดขึ้นใหม่นี้ ความพยายามเหล่านี้ทำขึ้นเพื่อบรรเทาข้อจำกัดเฉพาะที่มีอยู่ใน โลกของ RDBMS การรวมไม่สามารถทำได้ในตัวเลือก NoSQL บางตัว ดังนั้นคุณต้องเก็บสำเนาข้อมูลไว้หลายชุด เป็นไปได้มากว่าเกิดจากการขาดดัชนีส่วนกลางและข้อเท็จจริงที่ว่าข้อมูลถูกแบ่งพาร์ติชันข้ามเซิร์ฟเวอร์สินค้าโภคภัณฑ์โดยใช้คีย์ที่ใช้สำหรับการดึงข้อมูล ผู้ใช้ NoSQL มักจะคาดหวังกับเครื่องมือค้นหาข้อความแบบเต็มเช่น Lucene, Solr และ Sphinx แต่ก็ไม่ใช่สิ่งที่ดีที่สุด โซลูชันการปรับขนาด MarkLogic ได้รับการพิสูจน์แล้วว่าปรับใช้ในแนวนอนได้บนฮาร์ดแวร์สินค้าโภคภัณฑ์ที่มีความจุระดับเพตะไบต์

เป็นฐานข้อมูลประเภทที่แตกต่างจากฐานข้อมูลอื่นในตัวของมันเอง MarkLogic ไม่เคยถูกสร้างขึ้นเพื่อให้สามารถแก้ปัญหาเฉพาะได้ ได้รับการสร้างขึ้นใหม่ทั้งหมดเพื่อเป็นแพลตฟอร์มสำหรับแอปพลิเคชันระดับองค์กรโดยไม่คำนึงถึงขนาด

คลังข้อมูลการดำเนินงานยุคใหม่ของ MarkLogic เป็นเครื่องมือซอฟต์แวร์สำหรับการวิเคราะห์การดำเนินงาน

ไปที่ http://localhost:8000/appservices/ เพื่อค้นหาหน้า Application Services ด้วยส่วนฐานข้อมูลใน MarkLogic Server คุณสามารถเข้าถึงฐานข้อมูลทั้งหมดและลบฐานข้อมูล ตลอดจนสร้างและกำหนดค่าฐานข้อมูล

Marklogic ใช้ฐานข้อมูลใด

ปัจจุบันองค์กรส่วนใหญ่ต้องการฐานข้อมูลเพื่อดำเนินการ ใช้เพื่อรันแอปพลิเคชันธุรกรรม การดำเนินงาน และการวิเคราะห์จากศูนย์ข้อมูลและจัดการแหล่งข้อมูลที่หลากหลายอย่างปลอดภัย

แพลตฟอร์มของ MarkLogic ช่วยให้โหลด สืบค้น จัดการ และแสดงผลเนื้อหาพร้อมกันได้ คุณสามารถค้นหาเนื้อหาได้อย่างรวดเร็วหากมีการแปลงเป็น XML และจัดทำดัชนีโดยอัตโนมัติ Big Publishing ใช้การสืบค้นองค์ประกอบ XML การค้นหาความใกล้เคียง XML และการค้นหาข้อความแบบเต็มเพื่อปรับปรุงความสามารถในการค้นหา ภายใน 4 ถึง 5 เดือน บริษัทสามารถวางโซลูชันและเริ่มใช้งานได้ รัฐบาลของ Quakezone County ต้องการทำให้พนักงานของเทศมณฑล นักพัฒนา และผู้อยู่อาศัยสามารถเข้าถึงข้อมูลแบบเรียลไทม์ได้ง่ายขึ้นโดยการทำให้ง่ายขึ้นสำหรับพวกเขาในการดำเนินการดังกล่าว พวกเขาต้องการโซลูชันโครงสร้างพื้นฐานด้านไอทีที่จะดำเนินการได้อย่างรวดเร็วและง่ายดาย ด้วย MarkLogic เคาน์ตีสามารถดูและเชื่อมโยงข้อมูลได้หลายวิธี รวมถึงโดยการแปลงและเสริมข้อมูล

Time Traders Services แทนที่ระบบเดิมด้วย MarkLogic Server โซลูชันนี้ลดลงอย่างมากในแง่ของเวลาแฝงในการแจ้งเตือน ในขณะที่ให้ข้อมูลที่เกี่ยวข้องในทันทีแก่พอร์ทัลและอีเมลของลูกค้า ผู้ค้าทางการเงินจะได้เปรียบในสำนักงานและบนพื้นการซื้อขายโดยการแจ้งให้ลูกค้าทราบเกี่ยวกับการวิจัยใหม่ที่มีอยู่ MarkLogic ใช้เพื่อรักษาการติดตั้งที่เป็นความลับสุดยอดในรัฐบาลกลาง การแลกเปลี่ยนจะได้รับประโยชน์จากต้นทุนที่ต่ำกว่าของระบบฮาร์ดแวร์เมื่อ MarkLogic เพิ่มประสิทธิภาพฮาร์ดแวร์สินค้าโภคภัณฑ์ ด้วยประสิทธิภาพที่สูง ทำให้มีฮาร์ดแวร์เซิร์ฟเวอร์ให้แข่งขันน้อยลง แทนที่จะซื้อเซิร์ฟเวอร์ขนาดใหญ่และมีราคาแพงกว่า การเพิ่มความสามารถในการปรับขนาดทำให้สามารถติดตั้งเซิร์ฟเวอร์สินค้าได้มากขึ้น

ข้อดีหลักประการหนึ่งของ MarkLogic Data Hub คือความสามารถในการรวมเข้ากับแหล่งข้อมูลอื่นๆ ซอฟต์แวร์สามารถเชื่อมต่อกับระบบเดิมได้อย่างง่ายดาย เช่น ERP และ CRM ตลอดจนแหล่งข้อมูลที่ใหม่กว่า เช่น คลังข้อมูลลูกค้าและแหล่งข้อมูลการสตรีม นอกจากนี้ MarkLogic Data Hub ยังสามารถประมวลผลรูปแบบข้อมูลได้หลากหลาย ทำให้ง่ายต่อการนำเข้าข้อมูล ประการสุดท้าย MarkLogic Data Hub ใช้งานง่ายมาก เป็นโปรแกรมฟรี คุณจึงไม่ต้องจ่ายเงินเพื่อใช้งาน นอกจากนี้ โปรแกรมยังเป็นโอเพ่นซอร์ส ดังนั้นคุณจึงสามารถปรับแต่งให้ตรงกับความต้องการเฉพาะของคุณได้

ฐานข้อมูลหลายรุ่น: สิ่งที่ดีที่สุดของทั้งสองโลก

ตารางต่อไปนี้แสดงประเภทฐานข้อมูลทั่วไปสำหรับฐานข้อมูลหลายรุ่น ฐานข้อมูลหลายโมเดลจะช่วยให้คุณสามารถเลือกโมเดลข้อมูลที่มีค่าใช้จ่ายในการบำรุงรักษาน้อยกว่า การจัดทำดัชนีรูปแบบการค้นหาและการจัดเก็บข้อมูลธุรกรรมของ MarkLogic ช่วยให้สามารถรวมและเสริมข้อมูลภายในระบบได้ เป็นผลให้สามารถใช้เพื่อเรียกใช้กระบวนการ ETL นอกจากนี้ เนื่องจาก MarkLogic เป็นฐานข้อมูลกราฟ จึงเป็นตัวเลือกที่ยอดเยี่ยมสำหรับสามสแต็กสำหรับผู้ที่มองหาฐานข้อมูลกราฟ

Ldap เป็น Nosql หรือไม่

Ldap เป็น Nosql หรือไม่
แหล่งที่มาของรูปภาพ: kirelos

เนื่องจากแต่ละฐานข้อมูล NoSQL มาพร้อมกับโปรโตคอลของตนเอง การเลือกหนึ่งรายการจะเป็นการล็อกคุณไว้ในฐานข้อมูลประเภทนั้นเป็นหลัก หากคุณต้องเปลี่ยนเซิร์ฟเวอร์ คุณต้องเปลี่ยนไคลเอนต์ด้วย

เมื่อ Pearson Education ใช้งาน NoSql เพื่อโฮสต์ชั้นเรียนออนไลน์ บันทึกของนักเรียน และอื่นๆ ในกรณีนี้ ทุกคนในทีมต้องเริ่มต้นและใช้งาน Mongo อย่างรวดเร็ว เป็นเรื่องง่ายที่จะลืมบริการ Ldap ซึ่งใช้โดยเซิร์ฟเวอร์และเดสก์ท็อปหลายแสนเครื่องในโลก เมื่อใช้เครื่องมือคอนโซล 389-ds คุณสามารถสร้างวัตถุและคุณลักษณะใหม่ได้อย่างง่ายดาย ในแง่ของการประมวลผลแบบคลาวด์ ฉันจะใส่ดิสก์หลักสองแผ่นในแต่ละโซนเพื่อให้แน่ใจว่ามีการจำลองแบบ WAN (มัลติมาสเตอร์) คุณสามารถปรับระดับการจำลองแบบได้อย่างละเอียด หากต้องการแก้ไขสคีมา คุณสามารถทำได้ทางออนไลน์

ตัวอย่างของ Nosql คืออะไร?

อุตสาหกรรมส่วนใหญ่ที่ใช้ฐานข้อมูล NoSQL นั้นพึ่งพาฐานข้อมูลเหล่านี้เพื่อวัตถุประสงค์ที่หลากหลาย ประเภทของฐานข้อมูล NoSQL ที่ใช้ในกรณีที่กำหนดจะมีผลกระทบต่อการดำเนินการ ฐานข้อมูลเอกสาร เช่น MongoDB เป็นตัวอย่างของ ฐานข้อมูลวัตถุประสงค์ทั่วไป ข้อมูลจำนวนมากสามารถจัดเก็บในฐานข้อมูลคีย์-ค่า ทำให้การสืบค้นเป็นเรื่องง่าย

ประโยชน์ของฐานข้อมูล Nosql

แตกต่างจากฐานข้อมูลเชิงสัมพันธ์แบบดั้งเดิม ฐานข้อมูล NoSQL แตกต่างจากฐานข้อมูลเหล่านี้ตรงที่พวกเขาแยกตัวออกจากรูปแบบองค์กรข้อมูลแบบเดิม เพื่อสนับสนุนโครงสร้างที่ยืดหยุ่นมากขึ้นซึ่งช่วยให้สามารถเก็บข้อมูลแบบไดนามิกและกว้างใหญ่ได้มากขึ้น นี่เป็นข้อได้เปรียบเมื่อต้องปรับขนาดที่เก็บข้อมูลเพื่อการรับส่งข้อมูลที่มากขึ้น หรือเมื่อคุณต้องการตอบสนองความต้องการของผู้ใช้ที่แตกต่างกัน เนื่องจากชุดสิทธิประโยชน์ที่มีในฐานข้อมูล NoSQL จึงได้รับความนิยมเพิ่มขึ้นตลอดเวลา และไม่ใช่ทุกแอปพลิเคชันที่จะได้รับประโยชน์จากชุดสิทธิประโยชน์เหล่านี้ หากคุณกำลังมองหาที่เก็บข้อมูลที่ยืดหยุ่นมากขึ้นซึ่งสามารถรองรับความต้องการได้หลากหลายขึ้น ฐานข้อมูล NoSQL เป็นตัวเลือกที่ยอดเยี่ยม

Uber ใช้ sql หรือ Nosql หรือไม่

Uber ใช้ sql หรือ Nosql หรือไม่
ที่มารูปภาพ: intellipaat

เมื่อฐานข้อมูลที่ไม่มีอัลกอริทึมถูกใช้เพื่อจัดเก็บข้อมูล จะเรียกว่าฐานข้อมูล NoSQL เนื่องจากฐานข้อมูล NoSQL ไม่รองรับดัชนี (เนื่องจากไม่มีธุรกรรมแบบกระจาย) ทีมปฏิบัติตามของ Uber จึงใช้ตารางแยกต่างหากเพื่อจัดเก็บดัชนี

Uber เผยแพร่บทความบนเว็บไซต์ของพวกเขาเพื่ออธิบายสาเหตุที่ Uber เปลี่ยนจาก PostgreSQL เป็น InnoDB โพสต์นี้สร้างขึ้นจากบทความ Uber เพื่อพยายามทำความเข้าใจให้ดียิ่งขึ้น PostgreSQL จำเป็นต้องอัปเดตดัชนีทั้งหมดในตารางเสมอ เมื่ออัปเดตแถวเมื่อจัดทำดัชนีตาราง ดังที่อธิบายโดยละเอียดในบทความนี้ วิธีนี้ยังส่งผลให้ดิสก์ IOs เพิ่มขึ้นสำหรับการอัปเดตที่เปลี่ยนคอลัมน์ที่ไม่ได้จัดทำดัชนี ในบทความนี้ พวกเขาอธิบายการลงโทษดัชนีคลัสเตอร์เป็นข้อเสียเล็กน้อย ซึ่งมีความสำคัญหากคุณเรียกใช้แบบสอบถามจำนวนมากโดยใช้ดัชนีรอง บทความไม่ได้ระบุว่าบทลงโทษนี้ใช้กับคำสั่งที่มี where ไม่ใช่แค่เลือก ในทางกลับกันการสแกนเฉพาะดัชนีของ Postgres นั้นค่อนข้างไร้ประโยชน์

ดูเหมือนว่าจะทำงานได้ดีในกรณีการใช้งานที่เก็บคีย์ที่สำคัญในอนาคต มีแพ็คเกจที่ออกแบบมาเพื่อทำงานกับ SQL front-end (แต่มีฟังก์ชั่นน้อยมาก) Uber สร้างฐานข้อมูลของตนเอง (Schemaless) นอกเหนือจากการใช้ InnoDB และ MariaDB การแบ่งโหนดเป็นการดำเนินการที่สำคัญใน B-tree การแยกโหนดเกิดขึ้นเมื่อโหนดหนึ่งโหนดขึ้นไปไม่สามารถโฮสต์รายการใหม่ได้ ในกรณีที่เลวร้ายที่สุด การแยกจะขยายไปถึงโหนดรูท ซึ่งจะถูกแยกเช่นกันและจะถูกแทนที่ด้วยโหนดใหม่ เป็นผลให้ต้นไม้ทั้งต้นล้มลงทำให้ความสมดุลของดัชนีคงที่

จุดบกพร่องในกระบวนการจำลองแบบอาจทำให้ต้นไม้ส่วนใหญ่ไม่สามารถซ่อมแซมได้อย่างสมบูรณ์ เป็นไปได้ว่าต้นแบบจะไม่สามารถระบุได้ว่าแบบจำลองกำลังพยายามทำอะไร และจะลบข้อมูลที่ยังจำเป็นสำหรับการสืบค้นให้เสร็จสมบูรณ์ ปัญหานี้สามารถแก้ไขได้โดยการชะลอแอปพลิเคชันของสตรีมการจำลองสำหรับระยะหมดเวลาที่กำหนดค่าได้ ทำให้ธุรกรรมที่อ่านสามารถดำเนินการได้ มีวิศวกรบางคนที่ไม่ใช่ผู้เชี่ยวชาญด้านฐานข้อมูลและอาจไม่เข้าใจปัญหานี้เสมอไป โดยเฉพาะอย่างยิ่งเมื่อใช้ ORM ที่ปิดบังรายละเอียดระดับต่ำ เช่น ธุรกรรมที่เปิดอยู่ นักพัฒนาส่วนใหญ่ทราบดีว่าสามารถใช้ธุรกรรมเพื่อสำรองข้อมูลการเขียนได้ หากบริษัทจ้างคนจำนวนมากขึ้น คุณสมบัติของพวกเขาก็จะใกล้เคียงกับค่าเฉลี่ยมากขึ้น การเพิ่มขนาดกลุ่มตัวอย่างเกิดจากการจ้างคนเพิ่มขึ้น

กรณีการใช้งานของ Uber จำเป็นต้องใช้ Schemaless ซึ่งเป็น ฐานข้อมูล NoSQL ใหม่ บทความของพวกเขาชี้ให้เห็นว่า Postgres ถูกแทนที่ด้วย MySQL แต่ไม่ใช่ในกรณีนี้ แต่โซลูชันที่ปรับแต่งเองนั้นได้รับการสนับสนุนจาก MySQL ไม่มีการกล่าวถึงว่าข้อกำหนดของพวกเขาเปลี่ยนไปอย่างไรเมื่อพวกเขาเปลี่ยนไปใช้ PostgreSQL จาก MySQL ในบทความนี้ ดังนั้นจึงไม่มีวิธีใดที่จะบอกได้ มีเพียงสิ่งเดียวที่โดดเด่นในใจของผู้อ่าน: Postgres นั้นแย่มาก

เหตุใดฐานข้อมูล Nosql จึงเหมาะสำหรับ Ube

ฐานข้อมูล MySQL ของ Uber สร้างขึ้นจากฐานข้อมูล NoSQL ดังนั้นจึงสามารถสรุปได้จากข้อความที่พวกเขาใช้ฐานข้อมูลนี้ นอกจากนี้ยังสามารถอนุมานได้จากข้อมูลที่ฐานข้อมูล NoSQL นี้ถูกใช้เพื่อแคชและจัดคิวข้อมูล Amazon เป็นอีกหนึ่งบริษัทฐานข้อมูล NoSQL เนื่องจากมีชุดเครื่องมือที่ครอบคลุมสำหรับการพัฒนาแอปพลิเคชันที่ขับเคลื่อนด้วยฐานข้อมูล

Marklogic Nosql

MarkLogic เป็นฐานข้อมูล NoSQL ที่มีประสิทธิภาพซึ่งช่วยให้นักพัฒนาสามารถสร้างแอปพลิเคชันที่จัดการข้อมูลปริมาณมากได้อย่างรวดเร็วและง่ายดาย MarkLogic ใช้งานง่ายและปรับขนาดได้ง่าย ทำให้เป็นตัวเลือกที่เหมาะสำหรับองค์กรที่ต้องจัดการข้อมูลจำนวนมาก

MarkLogic Server เป็นฐานข้อมูลที่สร้างขึ้นใหม่ทั้งหมดเพื่อให้ผู้ใช้สามารถค้นหาข้อมูลที่ต่างกันจำนวนมากได้อย่างง่ายดาย MarkLogic รวมฐานข้อมูลภายใน ดัชนีรูปแบบการค้นหา และพฤติกรรมของเซิร์ฟเวอร์แอปพลิเคชันไว้ในระบบที่เป็นหนึ่งเดียวที่สามารถเรียกใช้พร้อมกันได้ เอกสาร XML และ JSON ใช้เป็นโมเดลข้อมูล และข้อมูลธุรกรรมจะถูกจัดเก็บไว้ใน ที่เก็บข้อมูลธุรกรรม ข้อมูลเอกสารสามารถเริ่มต้นเป็น XML หรือ JSON แต่ก็สามารถแปลงได้เมื่อนำเข้าแล้ว โดยทั่วไป โมเดลข้อมูลเอกสารประกอบด้วยข้อมูลที่เกี่ยวข้องทั้งหมดในเอกสารเดียวกัน ดังนั้น ข้อมูลจะถูกทำให้เป็นมาตรฐานก่อนที่จะเปิดเผยต่อสาธารณะ เนื้อหา XML สามารถกำหนดเป็นสคีมาเพื่อแสดงคลาสของโมเดลเนื้อหาของเอกสาร เมื่อเอกสารเฉพาะต้องมีโครงสร้างในลักษณะเฉพาะ จำเป็นอย่างยิ่งที่จะต้องมีตัวระบุสำหรับเอกสาร

XML schema สามารถนำเข้าไปยังฐานข้อมูล Schemas หรือวางไว้ในไดเร็กทอรี Config หลังจากนั้น คุณสามารถระบุชุดสกีมาสำหรับ App Server เฉพาะหรือกลุ่มเซิร์ฟเวอร์ได้ MarkLogic ยังรองรับสกีมา SQL เสมือนที่ให้บริบทสำหรับมุมมอง SQL ตามที่กำหนดไว้ในคู่มือการสร้างโมเดลข้อมูล SQL MarkLogic Server สามารถค้นหา จัดเก็บ และจัดการข้อมูลความหมายใน RDF triple ซึ่งจัดเก็บไว้ในหน่วยความจำ Semantics คือชุดของมาตรฐาน W3C ที่ช่วยให้การแลกเปลี่ยนข้อมูลที่เครื่องอ่านได้ (และข้อมูลเกี่ยวกับความสัมพันธ์ระหว่างข้อมูล) MarkLogic ช่วยให้คุณจัดเก็บ ค้นหา และจัดการข้อมูลประเภทนี้โดยใช้ SPARQL และ SPARQL Update ดั้งเดิม รวมถึง JavaScript, XQuery และ REST คุณสามารถเพิ่มประสิทธิภาพการจัดการข้อมูลไบนารีด้วยชุดกลไกของ MarkLogic Server

เอกสารไบนารีสามารถจัดเก็บตามขนาดของเอกสาร ซึ่งกำหนดโดยชุดของเกณฑ์ MarkLogic เป็นแอปพลิเคชันแบบเธรดเดียวที่ออกแบบมาสำหรับโปรเซสเซอร์หลายตัวในเวลาเดียวกัน มีพอร์ตซ็อกเก็ตจำนวนมากที่สามารถใช้สำหรับการสื่อสารภายนอกได้ แพลตฟอร์ม MarkLogic มีวัตถุประสงค์เพื่อให้ทั้งความเร็วและขนาด ข้อความค้นหาขั้นสูงใน MarkLogic เขียนด้วยข้อมูลหลายเทราไบต์ การปรับใช้จริงที่ใหญ่ที่สุดในขณะนี้เกิน 200 เทราไบต์และเอกสารหนึ่งพันล้านฉบับ เมื่อใช้คลัสเตอร์ ความพร้อมใช้งานระดับสูงจะบรรลุผลสำเร็จ

โดยทั่วไปแล้วเซิร์ฟเวอร์ประเภทนี้จะอยู่ใน 4 หรือ 8 คอร์, 64 หรือ 128 Gb หรือกล่องความจุที่มากกว่า Elastic Load Balancer (ELB) สร้างขึ้นใน Amazon Elastic Compute Cloud (EC2) ซึ่งทำให้ คลัสเตอร์ MarkLogic สามารถกระจายและปรับสมดุลการรับส่งข้อมูลของแอปพลิเคชันได้โดยอัตโนมัติ เพื่อปรับปรุงความพร้อมใช้งานของสภาพแวดล้อม EC2 D-Nodes สามารถคลัสเตอร์ในตำแหน่งเดียวกันได้

ฐานข้อมูล Marklogic คืออะไร

MarkLogic เป็นฐานข้อมูล NoSQL อันทรงพลังที่ช่วยให้นักพัฒนาสร้างแอปพลิเคชันได้เร็วขึ้นโดยมอบเครื่องมือที่จำเป็นในการทำงานกับข้อมูลทุกประเภท MarkLogic เป็นฐานข้อมูล NoSQL เดียวที่รวมพลังของฐานข้อมูลเชิงเอกสารเข้ากับความยืดหยุ่นของที่เก็บคีย์-ค่า ทำให้เป็นแพลตฟอร์มที่เหมาะสำหรับแอปพลิเคชันสมัยใหม่ในปัจจุบัน

เป็นแพลตฟอร์มการจัดการข้อมูลที่ทรงพลังซึ่งมอบระบบแบบครบวงจรสำหรับการจัดการข้อมูล ใช้โมเดลข้อมูลเอกสารใน XML และ JSON และจัดเก็บเอกสารในที่เก็บข้อมูลธุรกรรม ฮับข้อมูลตั้งอยู่ที่ด้านบนสุดของดาต้าเลค และประกอบด้วยข้อมูลคุณภาพสูง คัดสรร ปลอดภัย ไม่ซ้ำซ้อน จัดทำดัชนี และสามารถสืบค้นได้ นอกจากนี้ MarkLogic Data Hub ได้รับการออกแบบมาเพื่อจัดการชุดข้อมูลขนาดใหญ่ด้วยการจัดระดับข้อมูลอัตโนมัติที่จัดเก็บและดึงข้อมูลจากที่จัดเก็บข้อมูลดิบอย่างปลอดภัย

เหตุใดฐานข้อมูลกราฟจึงถูกแทนที่

ฐานข้อมูลกราฟกลายเป็นตัวเลือกอย่างรวดเร็วสำหรับการจัดเก็บข้อมูลในรูปแบบที่หลากหลายซึ่งยากต่อการจัดการด้วยตนเอง ฐานข้อมูล SQL แบบดั้งเดิมไม่สามารถจัดการการสืบค้นข้อมูลประเภทนี้ได้ และอาจมีประโยชน์มากในการจัดการกับแบบสอบถามประเภทนี้ หากคุณต้องการสืบค้นข้อมูลในรูปแบบที่ฐานข้อมูล SQL สามารถจัดการได้ รวมถึงหากคุณต้องการจัดเก็บข้อมูลในรูปแบบกราฟ MarkLogic เป็นตัวเลือกที่ดี

ฐานข้อมูล Marklogic Vs Mongodb

ฐานข้อมูล NoSQL ระดับองค์กรของ MarkLogic มีคุณสมบัติทั้งหมดที่คุณต้องการในแพลตฟอร์มเดียว ในทางกลับกัน MongoDB ใช้เพื่อจัดระเบียบความคิดขนาดใหญ่ MongoDB เป็นบริการ MongoDB ที่จัดเก็บข้อมูลในเอกสารที่คล้ายกับ JSON ซึ่งสามารถจัดโครงสร้างได้หลายวิธี

หากคุณมีข้อมูล META คุณสามารถใช้ MarkLogic ได้ เพราะจะดึงข้อมูลทุกอย่างได้อย่างรวดเร็ว มีทางเลือกที่ดีกว่าในการใช้ฐานข้อมูลเชิงสัมพันธ์ในกรณีที่จำเป็นต้องใช้ MongoDB เป็นเครื่องมือที่น่าทึ่งสำหรับแอพพลิเคชั่นที่หลากหลายเนื่องจากมีความยืดหยุ่นและใช้งานง่ายอย่างไม่น่าเชื่อ แม้จะมีการใช้โอเพ่นซอร์สในเกือบทุกอย่าง แต่ฐานข้อมูลแบ็กเอนด์ก็มีความสำคัญอย่างยิ่ง ฝ่ายสนับสนุนลูกค้าของ MarkLogic ตอบสนองและเป็นมืออาชีพอย่างมาก พวกเขาตอบสนองต่อประเด็นสำคัญและปัญหาคุณภาพการผลิตได้อย่างรวดเร็ว ฉันรอคอยที่จะใช้ทรัพยากรของ MongoDB เพื่อใช้ประโยชน์จากพลังของมัน

มีเพียงไม่กี่ด้านเท่านั้นที่สามารถปรับปรุงหรือทำให้ง่ายขึ้นได้ หากคุณยังไม่มี DBA หรือผู้ดูแลระบบที่มีความรู้เกี่ยวกับ MongoDB คุณควรไปกับผู้ให้บริการโฮสต์ MongoDB ที่เชี่ยวชาญในสาขานี้ เมื่อชุดข้อมูลของคุณเพิ่มขึ้น คุณสามารถใช้เครื่องมือจัดเก็บข้อมูลของ Cassandra เพื่อสร้างการเขียนแบบเวลาคงที่ สามารถใช้ MongoDB สำหรับการวิเคราะห์โดยใช้การสนับสนุน Hadoop แบบเนทีฟ

ฐานข้อมูลกราฟ Marklogic

MarkLogic เป็นฐานข้อมูลกราฟ ใช้แบบจำลองข้อมูลกราฟเพื่อจัดเก็บและสืบค้นข้อมูล ฐานข้อมูลกราฟคือฐานข้อมูลที่ใช้แบบจำลองข้อมูลกราฟเพื่อจัดเก็บและสืบค้นข้อมูล

คู่มือนักพัฒนากราฟความหมายเป็นสิ่งที่ต้องอ่านสำหรับทุกคนที่สนใจในด้านของกราฟความหมาย หัวข้อที่รวมอยู่ในคู่มือนี้ประกอบด้วย: สามารถดาวน์โหลดข้อมูลได้ การใช้ตัวอย่างเต็มรูปแบบของ DBPedia ของ Persondata (ทั้ง Turtle และภาษาอังกฤษ) คุณสามารถแสดงวิธีการใช้ Turtle หรือคำภาษาอังกฤษได้ ฐานข้อมูลเอกสารมีสามดัชนีและชุดคำศัพท์ที่สามารถเปิดใช้งานได้ตามค่าเริ่มต้น ก่อนใช้ฐานข้อมูลสำหรับสามเท่า ตรวจสอบให้แน่ใจว่าเปิดใช้งานทั้งสองตัวเลือกแล้ว mlcp เป็นวิธีที่เหมาะสำหรับการโหลด triple จำนวนมากในสภาพแวดล้อมเดสก์ท็อป Windows ฟังก์ชัน SPARQL ดั้งเดิมหรือฟังก์ชัน sem:sparQL ในตัวเป็นวิธีการที่ยอมรับได้สำหรับการดำเนินการ ค้นหา MarkLogic ส่วนการดาวน์โหลดชุดข้อมูลถือว่าคุณได้โหลดชุดข้อมูลตัวอย่างแล้ว

ศูนย์กลางข้อมูล Marklogic

Data Hub ของ MarkLogic เป็นอินเทอร์เฟซซอฟต์แวร์โอเพ่นซอร์สฟรีที่นำเข้าข้อมูลจากหลายแหล่ง ประสานข้อมูลให้เป็นมาสเตอร์ จากนั้นค้นหาและวิเคราะห์ โซลูชันนี้รันบน MarkLogic Server และมีวัตถุประสงค์เพื่อให้แพลตฟอร์มแบบครบวงจรสำหรับแอปพลิเคชันที่มีความสำคัญต่อภารกิจ

Marklogic ใช้สำหรับอะไร

MarkLogic เป็นฐานข้อมูลที่มีประสิทธิภาพซึ่งช่วยให้คุณสามารถจัดเก็บ จัดการ และค้นหาข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น มีการใช้โดยองค์กรในอุตสาหกรรมต่างๆ เพื่อขับเคลื่อนแอปพลิเคชันและเว็บไซต์ของตน MarkLogic เหมาะอย่างยิ่งสำหรับการจัดการข้อมูลจำนวนมากและการสืบค้นที่ซับซ้อน

เซิร์ฟเวอร์ Marklogic

MarkLogic Server เป็น แพลตฟอร์มฐานข้อมูล NoSQL อันทรงพลัง ที่ช่วยให้นักพัฒนาสามารถสร้างแอปพลิเคชันที่ซับซ้อนได้อย่างรวดเร็วและง่ายดาย ซึ่งใช้ประโยชน์จากข้อมูลทั้งหมดของพวกเขา โดยไม่คำนึงถึงโครงสร้างหรือตำแหน่งที่ตั้ง MarkLogic Server สร้างขึ้นบนสถาปัตยกรรมเฉพาะที่ผสมผสานสิ่งที่ดีที่สุดของโลกทั้งเชิงสัมพันธ์และ NoSQL ทำให้นักพัฒนามีความยืดหยุ่นในการทำงานกับข้อมูลในลักษณะที่ตรงกับความต้องการมากที่สุด

DocumentManager ซึ่งเป็นอินสแตนซ์ของ DatabaseClient ที่สร้างขึ้นสำหรับการจัดการเอกสารโดยเฉพาะ สามารถใช้ในการจัดการเอกสารได้ เพื่อสาธิตวิธีอ่านเอกสาร XML ให้ใช้ ReadXMLDocument.java ที่ใช้ Java ของ Marklogic ไลบรารี Java ReadMetadata แสดงวิธีการตรวจหาประเภทของเอกสารที่คุณได้รับ ตลอดจนวิธีจัดการอย่างถูกต้อง การแทรกเอกสารข้อความจะคล้ายกับการแทรกเอกสาร PDF แต่คุณต้องใช้ StringHandle หรือระบุรูปแบบตามที่แสดงในตัวอย่างก่อนหน้านี้ สามารถใช้ Java API เพื่อเข้าถึงเอกสารและข้อมูลเมตาได้หลายวิธี สามารถใช้เมธอด DeleteDocument.java เพื่อลบเอกสารหลายฉบับพร้อมกันได้ ดาวน์โหลดเอกสารขนาดใหญ่

เอกสารหนึ่งฉบับต่อครั้งอาจมีค่าใช้จ่ายสูงเมื่อใช้โครงร่างการรับรองความถูกต้องแบบแยกย่อย เนื่องจากจำเป็นต้องอัปโหลดเอกสารหนึ่งฉบับ เราใช้คำเช่นการค้นหาและข้อความค้นหาในลักษณะเดียวกันใน MarkLogic โดยไม่คำนึงถึงบริบทที่เราใช้ หากคุณต้องการแสดงผลการค้นหาที่หลากหลาย ไวยากรณ์ของข้อความค้นหาเป็นวิธีที่ง่ายและมีประสิทธิภาพในการดำเนินการดังกล่าว มีการระบุข้อความค้นหาโดยใช้เมธอด setCriteria ของเครื่องมือจัดการข้อความค้นหาของเรา หลังจากดึงอินสแตนซ์ข้อความค้นหาสตริงเริ่มต้นจากเครื่องมือจัดการข้อความค้นหาของเรา เป็นความจริงที่แม้แต่การค้นหาง่ายๆ ก็มีประสิทธิภาพมากหากใช้ในการกำหนดค่าการค้นหาเริ่มต้นของ MarkLogic ตามที่ระบุไว้ในข้อกำหนดของเคียวรี จะมีการใช้สามวิธีในการดำเนินการแต่ละเคียวรี สองตัวเลือกแรกให้คุณระบุตำแหน่งคิวรีหรือชุดคอลเลกชั่น

สุดท้ายช่วยให้คุณเชื่อมโยงข้อความค้นหากับชุดของตัวเลือกการค้นหาแบบกำหนดเองที่จัดเก็บไว้ในเซิร์ฟเวอร์ ต่อไปนี้คือรายการผลการค้นหา เมื่อเรียกใช้โปรแกรมและตรวจสอบคอนโซล คุณจะเห็นวิธีที่ MarkLogic แสดงผลการค้นหาใน XML โครงการกวดวิชาประกอบด้วยจาวาสคริปต์ชื่อ Search ResultsAsJSON ชวา หากคุณเรียกใช้โปรแกรม คุณจะเห็นผลการค้นหา JSON ดิบที่ดึงมาจากเซิร์ฟเวอร์ รับผลการค้นหาในรูปแบบ POJO โดยเรียกเมธอด getMatchResults()

คุณสามารถรับอาร์เรย์ของวัตถุ MatchDocumentSummary ได้โดยการส่งผ่านสตริง เมื่อเอกสารมีการค้นหา มันสามารถแสดงโดยวัตถุ MatchLocation ตัวเลือกเริ่มต้นที่มีชื่อจะถูกใช้หากคุณไม่ได้ระบุชื่ออย่างชัดเจน เนื่องจากความสำคัญใน Mark Logic จึงมีการใช้ข้อจำกัดบ่อยครั้ง การกำหนดค่าสำหรับชุดตัวเลือกทั้งหมดจะถูกเก็บไว้ที่ src/main/ml-options/options เมื่อสร้างหรือแทนที่ชุดตัวเลือก ข้อจำกัดที่ระบุไว้ในที่นี้มีให้ใช้งานในหลายรูปแบบ ทำโปรแกรม

เมธอดนี้ควรส่งคืนผลลัพธ์เดียวกันกับ CollectionSearch java จากผลลัพธ์ของสตริงการค้นหาใหม่นี้ เกณฑ์การรวบรวมของเชคเปียร์จึงถูกจัดให้เป็นส่วนหนึ่งของสตริงการค้นหาโดยข้อจำกัดของแท็ก อย่างที่คุณเห็น เราใช้คำสั่งต่อไปนี้เพื่อปรับใช้การกำหนดค่าของเรา คุณสามารถเปิดพรอมต์คำสั่งใหม่และไปที่ mlwatch ซึ่งการเปลี่ยนแปลงสคริปต์ของคุณจะถูกส่งไปที่ Mark Logic บริบทของคำได้รับการทดสอบแทนที่จะเป็นคีย์หรือองค์ประกอบในแง่ของข้อจำกัดของคำ ซึ่งคล้ายกับข้อจำกัดของค่า คำที่ตรงกันนั้นเกิดจากก้านดอก ซึ่งหมายความว่าจะใช้คำที่คล้ายกัน เช่น กลยุทธ์ และ กลยุทธ์ เราต้องสร้าง/แก้ไขไฟล์ต่อไปนี้เพื่อเปิดใช้งาน stemming:src/main/ml-config/databases/content-database

การเรียกใช้คำสั่งด้านล่างจะช่วยให้คุณเข้าใจขั้นตอน โมดูล gradle mlUpdateIndexes ใช้สำหรับอัปเดตตารางดัชนีในโมดูล gradle mlReindexDatabase เมื่อใช้ข้อจำกัดคุณสมบัติ เราสามารถค้นหาคุณสมบัติของเอกสารด้วยข้อมูลเมตา เราใช้ข้อมูลเมตาที่แยกระหว่างการนำเข้าและจัดเก็บเป็นคุณสมบัติของเอกสารเพื่อสร้างภาพของเรา เมื่อเราป้อนคำค้นหา 'คุณสมบัติ' คำนั้นจะนำไปใช้กับคุณสมบัติของเอกสารนั้นเท่านั้น มีการใช้เมธอด search() ในตัวจัดการแบบสอบถามเพื่อเรียกใช้แบบสอบถาม

Marklogic ใช้สำหรับอะไร?

MarkLogic Server เป็นเครื่องมือซอฟต์แวร์ที่จัดเก็บและจัดการข้อมูลที่หลากหลายเพื่อเรียกใช้แอปพลิเคชันธุรกรรม การดำเนินงาน และการวิเคราะห์

ฮับข้อมูล: โซลูชันครบวงจรสำหรับการจัดการข้อมูล

ฮับข้อมูลช่วยให้คุณควบคุมวิธีจัดการและเข้าถึงข้อมูลจากที่เก็บข้อมูลดิบได้อย่างสมบูรณ์ ใน MarkLogic การแบ่งชั้นข้อมูลอัตโนมัติช่วยให้มั่นใจว่าข้อมูลได้รับการจัดเก็บและเข้าถึงอย่างปลอดภัยจากที่จัดเก็บข้อมูลดิบ และทำให้การรวมข้อมูลง่ายขึ้น

ฉันจะเชื่อมต่อกับ Marklogic ได้อย่างไร

หลังจากติดตั้งและเปิดใช้ MarkLogic แล้ว ให้ไปที่อินเทอร์เฟซการดูแลระบบบนเบราว์เซอร์ (ที่ http://localhost:8001/) ซึ่งคุณจะได้เรียนรู้วิธีรับใบอนุญาตนักพัฒนาซอฟต์แวร์และกำหนดค่าผู้ดูแลระบบ

Marklogic: เซิร์ฟเวอร์แอปที่มี API ที่เหลือ

การใช้แอปพลิเคชันไคลเอนต์ REST API เพื่อโต้ตอบกับ MarkLogic Server โดยใช้อินสแตนซ์ REST API นั้นกลายเป็นเรื่องธรรมดามากขึ้น MarkLogic มีพนักงาน 500 คนและเป็นหนึ่งในผู้จำหน่ายเซิร์ฟเวอร์แอปรายใหญ่ที่สุดในตลาด ตามการคาดการณ์รายได้ พวกเขาจะมีรายได้สูงสุดที่ 100.0 ล้านดอลลาร์ในปี 2564 โดยมีรายได้เฉลี่ยต่อพนักงาน 200,000 ดอลลาร์