Die LinkedIn Sicherheitsreihe: Was ist Scraping?

Unsere oberste Priorität ist es, unseren Mitgliedern eine sichere Plattform zu bieten. Wir arbeiten täglich daran, ihre Daten zu schützen und ihnen die Kontrolle über die Informationen zu geben, die sie auf LinkedIn teilen. Unsere Global Trust Teams entwickeln und verwalten Modelle, um Content-Missbrauch, Cyberattacken und Scams zu erkennen und zu verhindern und unsere Mitglieder vor den Gefahren des Internets zu schützen. In diesem ersten Beitrag unserer Sicherheitsreihe möchten wir Ihnen einige Einblicke in dieses Thema geben.

Wir beginnen mit einem der schwierigsten Bereiche: Scraping.

Was genau ist Scraping?

Scraping gibt es schon seit den Anfängen des Internets, aber es wird zunehmend auf komplexere Weise eingesetzt. Das Scraping, von dem wir heute am häufigsten hören, ist das unautorisierte Scraping, bei dem Code und automatisierte Erfassungsmethoden eingesetzt werden, um (bis zu) Tausende von Anfragen pro Sekunde zu stellen, technische Barrieren zu umgehen und ohne Erlaubnis auf Informationen zuzugreifen. Die gewonnenen Daten können auf mehreren Websites gesammelt, durchkämmt und in großen Mengen verkauft werden. Sie werden für Phishing und andere Zwecke verwendet, um User:innen zur Preisgabe privater Informationen zu verleiten.

Scraping an sich ist nicht unbedingt etwas Schlechtes. Suchmaschinen sind grundsätzlich berechtigt, Informationen aus dem gesamten Internet zu sammeln und zu indexieren. Wenn Internetuser:innen Links mit Informationsauszügen finden, kommt diese Art von Scraping letztlich sowohl den Websites als auch den User:innen zugute. Problematisch wird es, wenn dies ohne Erlaubnis geschieht. In so einem Fall haben Sie keine Möglichkeit nachzuvollziehen, was mit Ihren Informationen passiert und wie sie verwendet werden. Dies kann auf vielen verschiedenen öffentlichen Websites geschehen, z. B. auf E-Commerce- oder Nachrichtenseiten oder in sozialen Netzwerken. Es ist nicht akzeptabel, wenn Ihre Daten ohne Ihre Zustimmung erfasst und für Zwecke verwendet werden, denen Sie nicht zugestimmt haben. Auf LinkedIn vertrauen uns unsere Mitglieder ihre Informationen an. Daher verbieten wir unautorisiertes Scraping auf unserer Plattform. 

Welche Praktiken gelten nicht als Scraping?

Unbefugtes Scraping stellt an sich noch keinen Verstoß oder Hacking dar. Es mag diesen Anschein erwecken, da Hacker:innen oft behaupten, wichtige Daten von einem Unternehmen erhalten zu haben. Scraping bedeutet jedoch nicht, dass ein:e Hacker:in in Sicherheitssysteme eindringen, Firewalls umgehen oder auf geschützte Netzwerkinformationen zugreifen kann. Unerlaubtes Scraping kann bedeuten, dass eine große Menge an Daten gesammelt und auf unvorhergesehene Weise verwendet wird. Auch ohne in ein Netzwerk einzudringen, kann unautorisiertes Scraping missbräuchlich sein. Daher setzen wir unser gesamtes Instrumentarium ein, einschließlich KI und rechtlicher Mittel, um solche Praktiken zu unterbinden und die Täter:innen zur Verantwortung zu ziehen. Kurz gesagt – und es ist wichtig, dies klarzustellen –, Hackerangriffe und Datenverletzungen sind nicht mit Scraping gleichzusetzen. Diese Themen werden wir in weiteren Beiträgen aus unserer Reihe behandeln.

Wie gehen wir gegen Scraping vor?

Unsere Teams erstellen, implementieren und verwalten Modelle und Regeln, die Missbrauch, einschließlich unerlaubtem Scraping, identifizieren und verhindern.  Lassen Sie uns einige der von uns verwendeten Begriffe definieren, um die Schutzmaßnahmen zu verdeutlichen, die wir gegen verschiedene Arten von Scraping ergreifen. Scraping öffentlicher Profile bezieht sich auf das Scraping von Informationen, die auf LinkedIn sichtbar sind, ohne in ein Konto eingeloggt zu sein. Beispiel: das öffentliche Profil eines Mitglieds. Eingeloggtes Scraping bezieht sich auf das Scraping von Informationen, die sichtbar sind, wenn jemand in einem Mitgliedskonto eingeloggt ist.

  • Um das Scraping von öffentlichen Profilen zu identifizieren, suchen unsere Modelle nach Anzeichen für automatisierte Profilaufrufe. Da unerlaubtes Scraping ein Risiko darstellt, werden unsere Modelle mehrmals am Tag neu trainiert und automatisiert, um neue Signale schnell zu erkennen. Unsere Tools zur Erkennung von Missbrauch arbeiten in großem Umfang, und unsere Infrastruktur ist so konzipiert, dass sie unsere Mitglieder und ihre Informationen schützt, ohne dabei die User Experience auf LinkedIn zu beeinträchtigen. Wir planen, fortschrittliche Indizes in unsere Machine-Learning-Modelle zu integrieren und sie häufiger zu trainieren, um sofort auf neue Angriffsmuster reagieren zu können.

  • Wir verfügen auch über Modelle zur Abwehr von eingeloggtem Scraping. Dabei suchen wir nach Anzeichen für Bot-ähnliche Aktivitäten. Wir verwenden Deep Learning, um Sequenzen von Nutzerverhalten als automatisiert zu klassifizieren, und Ausreißererkennung, um Aktivitäten zu identifizieren, die nicht von einer echten Person zu stammen scheinen. Wir haben den Code, den wir für die Ausreißererkennung verwenden, als Open Source zur Verfügung gestellt, so dass andere Unternehmen ihn ebenfalls zur Erkennung von Missbrauch nutzen können. Wenn wir feststellen, dass ein Mitglied Scraping betreibt, stellen wir Informationen zur Verfügung, wie dieses Verhalten korrigiert werden kann.  

  • Darüber hinaus wenden wir eine Reihe weiterer Schutzmaßnahmen an, um gefälschte Konten, die Scraping betreiben, in mehreren Stufen zu erkennen und zu entfernen. Unser Ziel ist es, Fake-Konten so früh wie möglich zu identifizieren, um die Sicherheit unserer Mitglieder zu gewährleisten.

Was können Mitglieder tun, um sich zu schützen?

Wir möchten, dass unsere Mitglieder ein klares Bild davon haben, welche Informationen sie auf LinkedIn bereitstellen. Jeden Tag schützen wir Ihre Informationen mit einer ganzen Reihe von fortschrittlichen Technologien. Nehmen Sie sich einen Moment Zeit, um die Informationen, die Sie hinzugefügt haben, zu überprüfen – von Kontaktangaben bis hin zur Berufserfahrung – und machen Sie sich mit Ihren Einstellungen vertraut. Werfen Sie auch einen Blick auf Ihre öffentliche Profilseite, um zu sehen, welche Informationen öffentlich sichtbar sind, und vergewissern Sie sich, dass dies genau die Informationen sind, die Sie für Suchmaschinen und andere Dienste außerhalb von LinkedIn sichtbar machen wollen. Wenn Sie möchten, können Sie die Auswahl einschränken oder anpassen. Danach ist es unsere Aufgabe, Ihre Einstellungen zu überwachen, um Ihre Sicherheit und die Ihrer Informationen zu gewährleisten.


Related articles