Monitoruj czas pracy swojej witryny za darmo dzięki Apify i Integromat

Opublikowany: 2019-06-08

Istnieje wiele usług monitorowania dostępności, niestety większość z nich wymaga miesięcznej subskrypcji. Te kilka darmowych, które faktycznie wydają się dość niezawodne, nie zapewniają dużej kontroli nad sposobem sprawdzania Twojej witryny. Moją ulubioną usługą monitorującą był kiedyś Pingdom, ale niedawno zrezygnowali z bezpłatnego planu, co zmusiło mnie do szukania czegoś nowego. Po kilku eksperymentach udało mi się skonfigurować Apify i Integromat w sposób, który odpowiadał moim potrzebom monitorowania.

Najpierw małe wprowadzenie obu usług:

Apify

Apify to „platforma do skrobania i automatyzacji sieci”. Zasadniczo umożliwia indeksowanie dowolnej witryny i przekształcanie dostępnych informacji w łatwy w użyciu interfejs API. Na przykład Google nie ma oficjalnego interfejsu API do pobierania wyników wyszukiwania, więc jedyną opcją jest zeskrobanie kodu HTML z Google SERP i wyodrębnienie potrzebnych danych. Apify może łatwo zautomatyzować ten proces. W naszym przypadku skonfigurujemy go do indeksowania naszej własnej witryny, aby sprawdzić, czy jest online.

Integromat

Ta usługa jest platformą automatyzacji online. Pozwala zdefiniować akcje, które są wykonywane na określonych wyzwalaczach. Na przykład możesz zdefiniować scenariusz, w którym nowe zadanie jest tworzone w aplikacji z listą rzeczy do zrobienia, gdy tylko ktoś prześle formularz Google. Innymi słowy integruje usługi, które nie komunikują się ze sobą bezpośrednio.

W naszym scenariuszu będziemy używać Integromatu do wysyłania powiadomień, gdy Apify zauważy problem.

Przegląd procesu

Oto krótki przegląd tego, jak to będzie działać:

  • Apify będzie indeksować stronę w Twojej witrynie w regularnych odstępach czasu i szukać słowa kluczowego
  • Moduł w Integromacie otrzyma wyniki po zakończeniu każdego indeksowania
  • Filtr sprawdzi dane indeksowania, aby sprawdzić, czy witryna jest offline lub czy nie znaleziono wymaganego słowa kluczowego
  • Jeśli strona jest offline, filtr pozwoli uruchomić drugi moduł Integromat i wyśle ​​Ci powiadomienie

Zacznijmy!

Konfiguracja Apify

  • Załóż darmowe konto Apify lub zaloguj się, jeśli masz już konto
  • Przejdź do sekcji robotów na swoim koncie i utwórz nowego robota
Utwórz nowy robot Apify
Utwórz nowy robot Apify
  • W zakładce ustawień podstawowych dodaj nazwę dla swojego robota
  • Wpisz adres URL, który chcesz sprawdzić w polu „Początkowe adresy URL”
  • Usuń wszystko z pola „Klikalne elementy”, ponieważ nie chcemy, aby robot poruszał się po witrynie. Chcemy tylko sprawdzić jedną stronę.
Apify podstawowe ustawienia robota
Apify podstawowe ustawienia robota
  • W obszarze „Funkcja strony” dodaj następujący kod. Sprawdza treść strony pod kątem słowa kluczowego „TWOJE SŁOWO KLUCZOWE TUTAJ”. Upewnij się, że zastąpiłeś to własnym słowem kluczowym.
 function pageFunction(context) { // called on every page the crawler visits, use it to extract data from it var $ = context.jQuery; var result = { title: $('title').text(), online: $('body').text().indexOf('YOUR KEYWORD HERE') !== -1 ? '1' : '0' }; return result; }
  • Przejdź do zakładki ustawień zaawansowanych
  • Ustaw „Maksymalna liczba stron na indeksowanie” na jeden, ponieważ chcemy sprawdzić tylko jedną stronę
  • Zapisz ustawienia robota
  • Przejdź do zakładki Uruchom konsolę
  • Kliknij przycisk Uruchom i upewnij się, że pod wynikami są wyświetlane prawidłowe wartości
Apify wyniki indeksowania
Apify wyniki indeksowania
  • Wybierz „Harmonogramy” z paska bocznego i kliknij „Utwórz nowy”
  • W polu „Wyrażenie Cron” w zakładce „Ustawienia” wpisz @hourly i zapisz ustawienia
  • Przejdź do zakładki „Roboty”, dodaj robota i zapisz. Teraz twój nowy robot będzie działał co godzinę.

Konfiguracja Integromatu

  • Załóż darmowe konto Integromat lub zaloguj się, jeśli masz już konto
  • Kliknij przycisk tworzenia nowego scenariusza w prawym górnym rogu ekranu
Kreta nowy scenariusz
  • Zostaniesz zapytany „Jakie usługi chcesz zintegrować?”. Wybierz Apify i naciśnij Dalej
Wybierz usługę Apify
Wybierz usługę Apify
  • Kliknij znak zapytania na środku ekranu i wybierz Apify
Dodaj moduł Apify
Dodaj moduł Apify
  • Wybierz „Obserwuj egzekucje robota” pod wyzwalaczami
Oglądaj egzekucje robotów
Oglądaj egzekucje robotów
  • Po wyświetleniu monitu o webhooka kliknij przycisk „Dodaj”
Dodaj nowego webhooka
Dodaj nowego webhooka
  • W wyskakującym okienku „Dodaj hak” kliknij przycisk „Dodaj” pod „Połączenie”
Dodaj nowe połączenie
  • W wyskakującym okienku „Utwórz połączenie” dodaj swoje dane uwierzytelniające Apify i kliknij przycisk Kontynuuj. Możesz uzyskać „Identyfikator użytkownika” i „Token API” w sekcji Account > Integrations na swoim koncie Apify.
  • Po dodaniu połączenia wybierz robota Apify utworzonego w poprzednim kroku z menu rozwijanego „Crawler”
Wybierz robota Apify
  • Kliknij „Zapisz” w wyskakującym okienku „Dodaj hak”
  • Kliknij „OK” w głównym wyskakującym okienku Apify
Zapisz webhooka
  • Nowy webhook jest gotowy. Uff!

Pomyślnie utworzyłeś detektor dla indeksowania Apify. Teraz musisz dodać akcję po zakończeniu indeksowania. W tym celu musisz dodać kolejny moduł. Tutaj masz możliwość dodania dowolnego modułu. Możesz dodać moduł Gmail, aby wysyłać powiadomienia do swojej skrzynki odbiorczej. Mam zamiar pominąć instrukcje do tej części, ponieważ instrukcje wyświetlane na ekranie są dość oczywiste. Osobiście wybrałem Slacka jako mój drugi moduł, ponieważ nie czułem się komfortowo, dając trzecią część dostępu do mojego e-maila.

Po dodaniu drugiego modułu kliknij trzy kropki łączące oba moduły i dodaj następujące wartości:

Oznacza to, że chcesz, aby drugi moduł działał tylko wtedy, gdy dane indeksowania wysłane przez Apify nie mają atrybutu „online” (w przypadku błędów przekroczenia limitu czasu serwera itp.) lub jest dostępny atrybut „online”, ale jego wartość jest równa 0 (strona załadowana poprawnie, ale nie znaleziono słowa kluczowego).

Testowanie

Otwórz ustawienia robota Apify i zapisz niedostępny adres URL jako wartość pola „Startowe adresy URL”. Teraz, gdy uruchomisz nowy crawl, w przewidywalny sposób zakończy się niepowodzeniem, uruchomi się drugi moduł w Integromacie i otrzymasz nowe powiadomienie!

To wszystko! Twoja strona internetowa jest teraz monitorowana przez całą dobę i nie musisz płacić ani dolara. Zachęcamy do zapoznania się z dwiema usługami wymienionymi w tym artykule, aby znaleźć więcej niesamowitych opcji i przypadków użycia.