ตรวจสอบเวลาทำงานของเว็บไซต์ของคุณฟรีด้วย Apify และ Integromat
เผยแพร่แล้ว: 2019-06-08มีบริการตรวจสอบสถานะการออนไลน์ค่อนข้างน้อย แต่ส่วนใหญ่ต้องสมัครสมาชิกรายเดือน ของฟรีไม่กี่อันที่ดูน่าเชื่อถือจริง ๆ ไม่ได้ให้การควบคุมวิธีการตรวจสอบเว็บไซต์ของคุณมากนัก บริการตรวจสอบที่ฉันชอบคือ Pingdom แต่เมื่อเร็ว ๆ นี้พวกเขายกเลิกแผนฟรีซึ่งทำให้ฉันต้องมองหาสิ่งใหม่ หลังจากการทดลอง ฉันสามารถตั้งค่า Apify และ Integromat ให้เหมาะกับความต้องการในการตรวจสอบของฉัน
ขั้นแรกเป็นการแนะนำเล็กน้อยของบริการทั้งสอง:
Apify
Apify คือ “แพลตฟอร์มการขูดเว็บและระบบอัตโนมัติ” โดยทั่วไปจะช่วยให้คุณสามารถรวบรวมข้อมูลเว็บไซต์และแปลงข้อมูลที่มีอยู่ให้เป็น API ที่ใช้งานง่าย ตัวอย่างเช่น Google ไม่มี API อย่างเป็นทางการสำหรับการดึงผลการค้นหา ดังนั้นทางเลือกเดียวคือการขูด HTML จาก Google SERP และดึงข้อมูลที่คุณต้องการ Apify สามารถทำให้กระบวนการนี้เป็นอัตโนมัติสำหรับคุณได้อย่างง่ายดาย ในกรณีของเรา เราจะกำหนดค่าให้รวบรวมข้อมูลเว็บไซต์ของเราเพื่อดูว่าออนไลน์อยู่หรือไม่
อินเทโกรมาต์
บริการนี้เป็นแพลตฟอร์มอัตโนมัติออนไลน์ ช่วยให้คุณกำหนดการกระทำที่ดำเนินการกับทริกเกอร์บางตัว ตัวอย่างเช่น คุณสามารถกำหนดสถานการณ์สมมติที่มีการสร้างงานใหม่ในแอปรายการสิ่งที่ต้องทำทันทีที่มีคนส่งแบบฟอร์ม Google กล่าวคือรวมบริการที่ไม่ได้พูดคุยกันโดยตรง
สำหรับสถานการณ์ของเรา เราจะใช้ Integromat เพื่อส่งการแจ้งเตือนเมื่อ Apify พบปัญหา
ภาพรวมกระบวนการ
นี่คือภาพรวมโดยย่อเกี่ยวกับวิธีการทำงาน:
- Apify จะรวบรวมข้อมูลหน้าบนเว็บไซต์ของคุณเป็นระยะๆ และค้นหาคำสำคัญ
- โมดูลใน Integromat จะได้รับผลลัพธ์เมื่อสิ้นสุดการรวบรวมข้อมูลแต่ละครั้ง
- ตัวกรองจะตรวจสอบข้อมูลการรวบรวมข้อมูลเพื่อดูว่าเว็บไซต์ออฟไลน์หรือไม่พบคำหลักที่ต้องการ
- หากเว็บไซต์ออฟไลน์ ตัวกรองจะปล่อยให้โมดูล Integromat ที่สองทำงานและส่งการแจ้งเตือนให้คุณ
มาเริ่มกันเลย!
ตั้งค่า Apify
- ลงทะเบียนสำหรับบัญชี Apify ฟรีหรือเข้าสู่ระบบหากคุณมีอยู่แล้ว
- ไปที่ส่วนโปรแกรมรวบรวมข้อมูลในบัญชีของคุณและสร้างโปรแกรมรวบรวมข้อมูลใหม่

- ในแท็บการตั้งค่าพื้นฐาน ให้เพิ่มชื่อสำหรับโปรแกรมรวบรวมข้อมูลของคุณ
- ป้อน URL ที่คุณต้องการตรวจสอบในช่อง "URL เริ่มต้น"
- ลบทุกอย่างออกจากฟิลด์ "องค์ประกอบที่คลิกได้" เนื่องจากเราไม่ต้องการให้โปรแกรมรวบรวมข้อมูลย้ายไปมาในเว็บไซต์ เราแค่ต้องการตรวจสอบหน้าเดียว

- ในส่วน "ฟังก์ชันเพจ" ให้เพิ่มโค้ดต่อไปนี้ จะตรวจสอบเนื้อหาของหน้าสำหรับคำหลัก "YOUR KEYWORD HERE" ตรวจสอบให้แน่ใจว่าคุณแทนที่สิ่งนี้ด้วยคำหลักของคุณเอง
function pageFunction(context) { // called on every page the crawler visits, use it to extract data from it var $ = context.jQuery; var result = { title: $('title').text(), online: $('body').text().indexOf('YOUR KEYWORD HERE') !== -1 ? '1' : '0' }; return result; }
- สลับไปที่แท็บการตั้งค่าขั้นสูง
- ตั้งค่า “จำนวนหน้าสูงสุดต่อการรวบรวมข้อมูล” เป็นหนึ่งเพราะเราต้องการตรวจสอบหน้าเดียวเท่านั้น
- บันทึกการตั้งค่าโปรแกรมรวบรวมข้อมูล
- สลับไปที่แท็บ Run Console
- คลิกปุ่มเรียกใช้และตรวจดูให้แน่ใจว่าค่าที่ถูกต้องแสดงอยู่ใต้ผลลัพธ์

- เลือก "กำหนดการ" จากแถบด้านข้างแล้วคลิก "สร้างใหม่"

- ในฟิลด์ "นิพจน์ Cron" ใต้แท็บ "การตั้งค่า" ให้ป้อน @hourly และบันทึกการตั้งค่า
- สลับไปที่แท็บ "โปรแกรมรวบรวมข้อมูล" เพิ่มโปรแกรมรวบรวมข้อมูลแล้วบันทึก ตอนนี้โปรแกรมรวบรวมข้อมูลใหม่ของคุณจะทำงานทุกชั่วโมง
ตั้งค่า Integromat
- ลงทะเบียนสำหรับบัญชี Integromat ฟรีหรือเข้าสู่ระบบหากคุณมีอยู่แล้ว
- คลิกปุ่มสร้างสถานการณ์ใหม่ที่มุมบนขวาของหน้าจอ

- คุณจะถูกถามว่า "คุณต้องการรวมบริการใด" เลือก Apify แล้วกดดำเนินการต่อ

- คลิกเครื่องหมายคำถามตรงกลางหน้าจอแล้วเลือก Apify

- เลือก “ดูการดำเนินการของโปรแกรมรวบรวมข้อมูล” ภายใต้ทริกเกอร์

- เมื่อได้รับแจ้งสำหรับเว็บฮุค ให้คลิกปุ่ม “เพิ่ม”

- ในป๊อปอัป "เพิ่มเบ็ด" ให้คลิกปุ่ม "เพิ่ม" ใต้ "การเชื่อมต่อ"

- ในป๊อปอัป "สร้างการเชื่อมต่อ" ให้เพิ่มข้อมูลรับรอง Apify ของคุณและคลิกดำเนินการต่อ คุณสามารถรับ “User ID” และ “API Token” ได้ภายใต้
Account > Integrations
ทำงานในบัญชี Apify ของคุณ
- เมื่อเพิ่มการเชื่อมต่อแล้ว ให้เลือกโปรแกรมรวบรวมข้อมูล Apify ที่คุณสร้างในขั้นตอนก่อนหน้าจากดรอปดาวน์ “โปรแกรมรวบรวมข้อมูล”

- คลิก "บันทึก" ในป๊อปอัป "เพิ่มเบ็ด"
- คลิก "ตกลง" ในป๊อปอัป Apify หลัก

- เว็บฮุคใหม่พร้อมแล้ว ว้าว!
ตอนนี้คุณได้สร้าง Listener สำหรับการรวบรวมข้อมูล Apify เรียบร้อยแล้ว ตอนนี้ คุณต้องเพิ่มการดำเนินการเมื่อการรวบรวมข้อมูลเสร็จสิ้น สำหรับสิ่งนี้ คุณต้องเพิ่มโมดูลอื่น ที่นี่คุณมีตัวเลือกที่จะเพิ่มโมดูลใดก็ได้ที่คุณต้องการ คุณสามารถเลือกเพิ่มโมดูล Gmail เพื่อส่งการแจ้งเตือนไปยังกล่องจดหมายของคุณ ฉันจะข้ามคำแนะนำสำหรับส่วนนี้เนื่องจากคำแนะนำบนหน้าจออธิบายได้ชัดเจนในตัวเอง โดยส่วนตัวแล้วฉันเลือก Slack เป็นโมดูลที่สองเพราะฉันไม่สะดวกที่จะให้ส่วนที่สามเข้าถึงอีเมลของฉันได้

เมื่อคุณเพิ่มโมดูลที่สองแล้ว ให้คลิกจุดสามจุดที่เชื่อมต่อทั้งสองโมดูลและเพิ่มค่าเหล่านี้:

ซึ่งหมายความว่าคุณต้องการให้โมดูลที่สองทำงานก็ต่อเมื่อข้อมูลการตระเวนที่ส่งโดย Apify ไม่มีแอตทริบิวต์ 'ออนไลน์' (สำหรับข้อผิดพลาดการหมดเวลาของเซิร์ฟเวอร์ ฯลฯ) หรือมีแอตทริบิวต์ 'ออนไลน์' ที่พร้อมใช้งาน แต่ค่าของโมดูลนั้นเท่ากับ 0 (หน้าเว็บโหลดได้ แต่ไม่พบคำหลัก)
การทดสอบ
เปิดการตั้งค่าโปรแกรมรวบรวมข้อมูล Apify และบันทึก URL ที่ไม่สามารถเข้าถึงได้เป็นค่าฟิลด์ "URL เริ่มต้น" ตอนนี้ เมื่อคุณเรียกใช้การรวบรวมข้อมูลใหม่ การรวบรวมข้อมูลจะล้มเหลวอย่างที่คาดไม่ถึง โมดูลที่สองใน Integromat จะถูกทริกเกอร์ และคุณจะได้รับการแจ้งเตือนใหม่!
นั่นคือทั้งหมด! ขณะนี้เว็บไซต์ของคุณกำลังถูกตรวจสอบตลอดเวลา และคุณไม่ต้องจ่ายเงินแม้แต่ดอลลาร์เดียว อย่าลังเลที่จะสำรวจบริการทั้งสองที่กล่าวถึงในบทความนี้เพื่อค้นหาตัวเลือกและกรณีการใช้งานที่ยอดเยี่ยมยิ่งขึ้น