Ein Webcrawler (auch bekannt als Web Spider oder Web Robot) ist ein Programm oder automatisiertes Script, das das World Wide Web auf methodische, automatisierte Weise durchsucht.

Die bevorzugte Methode von Tangiblee zum Sammeln von Produktdaten von Ihrer Website ist die Verwendung unserer Webcrawler. The Crawler of Tangiblee is so designed, that it simulated the activity of a individual visitors to avoid störungen or performance problems with your website.

So funktioniert der Crawler:

Unser Bot „scraptet“ Daten von Ihrer Website, weil er regelmäßig in einer vereinbarten Häufigkeit gecrawlt wird, von allen 15 Minuten bis einmal täglich.
Unser Crawler analysiert automatisch die Dimensionsdaten von jedem PDP, unabhängig von dessen Format (Text, Zahlen, Einheiten usw.) oder der Position auf der Seite.
The Crawler checks the product images and select the image with the highest resolution and the most capture angle from the most, your product is best in the performance.

Bitte beachten Sie:

The crawling runs completely independent from JS snippet on the webpages, on where the actual tangiblee-UX is displayed. We crawlen not after information, when we load a page and run our JS snippet.
Jeder Crawling-Job für die Website eines Einzelhändlers wird einmal täglich erstellt. This parameter can be changed so that all 15 minutes is created, if a higher crawling required.
When an crawling-job was created, he will added the crawling-warteschlange our platform and as FIFO — first rein, first out. In den meisten Fällen wird der Job sofort gestartet, da normalerweise ein Mitarbeiter verfügbar ist, der den Job ausführt.
Por required is additional parameters, with which can be controlled the frequency of page calls, during a specific crawling job will performed.

What requires Tangiblee by me, to start with the crawlen my website?

Abhängig von den Sicherheitsprotokollen auf Ihrer Website benötigt Tangiblee in der Regel nichts von Ihnen, um mit dem Crawlen Ihrer Website zu beginnen.

Was ist, wenn die Sicherheitsprotokolle meiner Website den Bot-Traffic spezifisch einschränken?

Tangiblee is available our ip address for the whitelist on your website. If they set the IP address of Tangiblee to the Whitelist, you have only access on the Crawling Bot of Tangiblee, during the security protocol for the „Black-Bot“ -traffic wird gleichzeitig beibehalten.

Hier sind unsere Crawler-Informationen für Whitelisting:

Benutzeragent: TangiBleebot/1.0.0.0 (http://tangiblee.com/bot)

[.good] Tangiblee is never need or request access on the urspringe quellfiles your website. Dieser Crawler hat KEINEN Einfluss auf die Ladezeit und schafft auch keine Sicherheitslücken für Ihre Website oder deren Leistung. [.good]

Qué sammelt Tangiblee beim Crawlen auf meiner Website?

Produkt-SKU #
Titel des Produkts
Produkt-URL
URL der Kategorie
URL des Produktbildes

Woher weiß Tangiblee, welches Produktbild muss es auswählen?

Tangiblee can identify the specific image, that works with our solution.

Was ist, wenn ich Tangiblee nicht erlaube, meine Website zu crawlen?

Crawling is the preferred method of Tangiblee. Wenn Sie jedoch möchten, dass Tangiblee Ihre Website nicht crawlt, erkunden Sie Ihre Optionen hier.

web crawling, Produkt Daten extraction, crawl Frequenz, image selection, Katalog ingestion, Crawler Verhalten

Tangiblees Web-Crawler erfasst Produktabmessungen, Bilder und Metadaten von Ihren PDPs. Crawl-Frequenz, Datenauswahllogik und Optimierung Ihrer Seiten für den Crawler.

Wie funktioniert das Web-Crawling von Tangiblee?