Lesehilfe für gedbas?

  • Hallo zusammen,


    ist diese Funktion neu?
    Gerade gesehen bei Eingabe zu einem Namen in gedbas:


    Sie können mithelfen unsere Daten zu verbessern, indem Sie freiwillig die Geburtsdaten aus beiden Einträgen eingeben. Die Suche funktionert auch ohne diese Eingabe.


    An und für sich eine gute Sache, aber diese Daten sind sehr gut zu erkennen. Warum diese Nachfrage?

    Fünf sind geladen, zehn sind gekommen. Ich gieß Wasser zur Suppe und heiß alle willkommen.


    Viele Grüße, Ursula

  • Hallo Ursula,


    gib doch bitte mal ein Bespiel, Link oder einen Screenshot. Bei Gedbas gibt es ja eigentlich gar keine Scans von Originalen, wo man etwas erfassen könnte. Klingt eher nach einem DES Projekt.

  • Hallo Simone,


    klick einfach gedbas an, dann erscheint sofort die Bitte um Mithilfe.
    Ich denke, es sind die Angaben zu den Verlustlisten.


    Schönen Abend

    Fünf sind geladen, zehn sind gekommen. Ich gieß Wasser zur Suppe und heiß alle willkommen.


    Viele Grüße, Ursula

  • Schon seit einiger Zeit setzen wir beim DES und bei den GEDBAS-Kommentaren erfolgreich Captchas ein, um Spamprogramme außen vor zu halten und gleichzeitig Daten für die Verlustlisten zu sammeln.


    Nun habe ich mir überlegt, wie groß wohl die Bereitschaft ist, vor einer Suche freiwillig Daten beizutragen. Dazu habe ich gestern unter die GEDBAS-Suche das DES-Captcha eingebaut mit dem Hinweis, dass die Mithilfe freiwillig und ohne Einfluss auf die Suche ist.


    Nach zwei Stunden (5. März 12 bis 14 Uhr) habe ich zum ersten Mal nachgesehen und war geschockt: nur in 1,2% der Fälle wurde das Captcha ausgefüllt. Können die GEDBAS-Nutzer so eigennützig sein?


    Zugleich war ich über die hohe Zahl von Suchen erstaunt: 3.100 Abfragen pro Stunde - das ist fast eine Suche pro Sekunde. Mir dämmerte schnell, dass dies Suchprogramme sind, die GEDBAS an der Suchmaske vorbei abfragen. Also habe ich schnell eine Ergänzung programmiert, die diese Art von Programmen sicher erkennt. Damit habe ich die Messung knapp 17 Stunden laufen lassen. Und nun ergibt sich ein klareres Bild:

    • 88% der Suchen in GEDBAS wurden automatisiert von Programmen an der Suchmaske vorbei durchgeführt.
    • Von den (vermutlich) von Menschen durchgeführten Suche wurde nur in 9% der Fälle das Captcha ausgefüllt.

    Erstaunlich dabei ist, dass nur 30% der Captchas richtig waren. Bei den bisherigen Einsätzen lag diese Zahl deutlich höher - auch wenn ich gerade keine präzisen Messwerte zur Hand habe. Eine Erklärung wäre, dass die Suchenden wirklich nicht verstanden haben, was sie beim Captcha eingeben sollen. Die andere Erklärung ist, dass hier doch Programme die Suchmaske ausgefüllt haben und daher das Captcha nicht lösen konnten.

  • Guten Morgen Jesper,


    ich gehörte zu den 1,2 %. Und habe darüber hinaus noch viele folgende Anfragen ausgefüllt.


    Wie ich schon anmerkte, eigentlich eine sinnvolle Sache, aber nur wenn erkennbar ist, dass es Nutzen bringt. Hier jedoch sind die Daten so deutlich, dass man sich fragt, warum müssen die noch ein zweites Mal bestätigt werden.


    Schönen Tag

    Fünf sind geladen, zehn sind gekommen. Ich gieß Wasser zur Suppe und heiß alle willkommen.


    Viele Grüße, Ursula

  • Hier jedoch sind die Daten so deutlich, dass man sich fragt, warum müssen die noch ein zweites Mal bestätigt werden.

    Wir haben die Geburtsdaten bislang noch gar nicht erfasst. Es werden also tatsächlich neue Informationen gesammelt.

  • Danke,


    aber wie organisiert ihr das? Sammelt ihr die Daten, die die meisten "richtigen" Antworten haben? Und filtert die "gefakten" raus?

    Fünf sind geladen, zehn sind gekommen. Ich gieß Wasser zur Suppe und heiß alle willkommen.


    Viele Grüße, Ursula

  • Hallo Jesper,


    mich würde interessieren: Was suchen die Bots? Werden sie von Unternehmen/Personen betrieben, die Interesse an genealogischen Daten haben oder handelt es sich um Suchmaschinen wie Google & Co.?


    Generell habe ich ein wenig Zweifel, ob die DES Abfrage - so ehrenwert die Intention ist - an der Stelle wirklich gut platziert ist. Meiner Erfahrung nach sind die Leute so auf das Suchen fixiert, dass sie sich eher von so einer "Hürde" (auch wenn es eigentlich keine ist) eher genevt fühlen könnten.


    Ich habe dann gerade mal ein paar Daten erfassen wollen - ohne aber die Suche zu nutzen. Habe also die Geburtsdaten eingetippt und auf Suche geklickt. Dann bekomme ich eine Fehlermeldung "Suche nicht möglich". Ich weiß auch nicht, ob die eingetippten Geburtsdaten überhaupt erfasst wurden. Daher zögere ich nun, weitere Daten zu erfassen. Dies einfach mal aus Nutzersicht geschildert...

  • Danke,


    aber wie organisiert ihr das? Sammelt ihr die Daten, die die meisten "richtigen" Antworten haben? Und filtert die "gefakten" raus?

    Ich glaube, es geht in etwa so, dass jeder Eintrag 2-mal von unterschiedlichen Personen erfasst wird. Stimmen die Daten überein, dann werden sie als korrekt betrachtet. Gibt es Abweichungen, dann wird der Eintrag nochmal zur Erfassung gegeben.

  • Ich habe dann gerade mal ein paar Daten erfassen wollen - ohne aber die Suche zu nutzen. Habe also die Geburtsdaten eingetippt und auf Suche geklickt. Dann bekomme ich eine Fehlermeldung "Suche nicht möglich".


    Hallo Simone,


    das hatte ich noch nicht. Wenn es dem Projekt nützt, mach ich ab und zu ein paar Angaben.


    Schönen Tag

    Fünf sind geladen, zehn sind gekommen. Ich gieß Wasser zur Suppe und heiß alle willkommen.


    Viele Grüße, Ursula

  • Hallo Simone,


    Zitat

    mich würde interessieren: Was suchen die Bots?


    Jede Art von Informationen und Daten. Diese müssen jetzt nicht wichtig oder interessant sein ... können es aber im Laufe der weiteren Datensammlung noch werden ... und dann auch finanziell interessant werden :)


    Zitat

    Werden sie von Unternehmen/Personen betrieben, die Interesse an genealogischen Daten haben


    Auch dieser Personenkreis kann natürlich eigene Suchmaschinen über entsprechende Webseiten laufen lassen um Daten zu sammeln.


    Zitat

    oder handelt es sich um Suchmaschinen wie Google & Co.?


    Diese sind mit Sicherheit unterwegs!!! Es sei denn man würde sie aussperren, die Zugriffe erschweren ... bestimmte Daten vor ihnen schützen etc.


    Jede Veröffentlichung im Internet, ob Daten, Bilder, Beiträge, Adressen etc. sind für Suchmaschinenbetreiber wertvoll! Diese arbeiten in den wenigsten Fällen uneigennützig. Und jede Art von Daten kann wertvoll sein ... wenn nicht jetzt ... dann später wenn über diese Daten Profile erstellt werden können. Alleine das du schon bei der Webseite XYZ nach XYZ sucht ... ist ein Ereignis das der Speicherung würdig ist.


    Das ist aber mit den Daten die via App (Zugriffe müssen ja meistens frei sein ... auch wenn ein Spiel nichts mit dem Telefonbucheinträgen auf dem Handy zu tun hat) nichts anderes. Auch diese Daten werden gesammelt - da muss sich niemand was vormachen! Aber wir haben ja alle nichts zu verbergen ;-) Und genau diese Einstellung macht es den Datensammlern besonders leicht! Aber ... wir alle sind auch von Geburt aus mit einem besonderen Organ ausgestattet das uns erlaubt Einfluss zu nehmen - unser Hirn! ;-) Und das sollte man wirklich nutzen! Auch wenn Apps, Webseiten, Links etc. noch so interessant erscheinen ...


    Nur mal so zum nachlesen ... hier und da ... aber man kann natürlich, bei Interesse noch viel mehr im Internet über das Thema nachlesen. Klar sollte aber sein das jede Art von Daten für andere interessant sein kann und man sich überlegen sollte warum man diese in das Internet stellt, an welche Stelle und mit welchen Schutzmaßnahmen. Und selbst wenn man diese Daten in einem geschützten Bereich einer Webseite ablegt ... die Daten sind raus ... und können natürlich auch dort, zwar erschwert!, gefunden werden. Alles nur eine Frage der Energie und des Wissens das jemand mitbringt wenn er auf Datensuche ist - warum auch immer!


    Das nur als kleinen Einwurf zu deiner Frage was Bots so suchen und warum ... die haben mit Sicherheit noch mehr Gründe die sie uns aber nicht so ohne weiteres verraten werden ;-)


    MfG Watf

  • Hallo Rotraud,


    es hängt halt immer von den Interessen desjenigen ab, welcher im Hintergrund agieren will. Und man kann entsprechende Programme auch anders verwenden ... der "Fortschritt" unserer technischen Möglichkeiten wird immer wieder interessante Betätigungsfelder bieten. Wie z.B hier. Die Einsatzmöglichkeiten sind so gut wie grenzenlos :) Das sollte man halt immer im Hinterkopf haben wenn man im Netz tätig ist.


    MfG Watf

  • Hallo,


    hier ist ein neuer Beitrag im CompGen-Blog, der etwas mehr Aufschluss zu dem DES-Erfassungstest auf GOV bringt.
    Möge es nutzen!

    Freundliche Grüße
    Jörg


    Berlin und Umgebung: Mohr, Hartung, Zienicke, Krusnick, Grünack, Linto (vor 1750); Magdeburger Börde (rund um Egeln, etwa 1600 - 1800)
    Gera: Dix (vor 1740); Wunstorf: Brandes, Steinmann (vor 1800), Hildesheim: Michael (vor 1800); Gönningen (und Umgebung, vor 1650)

  • Ich habe dann gerade mal ein paar Daten erfassen wollen - ohne aber die Suche zu nutzen. Habe also die Geburtsdaten eingetippt und auf Suche geklickt. Dann bekomme ich eine Fehlermeldung "Suche nicht möglich". Ich weiß auch nicht, ob die eingetippten Geburtsdaten überhaupt erfasst wurden. Daher zögere ich nun, weitere Daten zu erfassen. Dies einfach mal aus Nutzersicht geschildert...

    Hallo Simone,


    nach der Eingabe der Geburtsdaten muss man den grauen 'Hörnchen' Button auf der rechten Seite klicken.
    Klickt man jedoch den Suchen-Button ist das die Fehlermeldung weil er mit leeren Suchfeldern sucht.

    Gruß
    Michael Lauffs
    Aachen, Eschweiler, Stolberg

    www.Lauffs.de

    Man sollte eine Dummheit nicht zweimal machen, es gibt doch so viele davon.

  • nach der Eingabe der Geburtsdaten muss man den grauen 'Hörnchen' Button auf der rechten Seite klicken.
    Klickt man jedoch den Suchen-Button ist das die Fehlermeldung weil er mit leeren Suchfeldern sucht.

    Das kenne ich so nicht. Nach der Eingabe der Daten auf "suchen" klicken. Es erscheint danach wieder ein neues "Pärchen". Auf das rechte hellgrüne Feld zu klicken, ist eine Möglichkeit, ein anderes Datenpaar zu erhalten.

    Fünf sind geladen, zehn sind gekommen. Ich gieß Wasser zur Suppe und heiß alle willkommen.


    Viele Grüße, Ursula

  • Auf das rechte hellgrüne Feld zu klicken, ist eine Möglichkeit, ein anderes Datenpaar zu erhalten.

    Falsch.


    Auf dieses Feld klicken übernimmt die unterhalb der Grafik eingebenen Daten in die Verlustlisten Datenbank und ordnet sie den Namen zu, die in der Grafik stehen.
    Damit wird die Verlustlisten Datenbank durch unsere Zuarbeit mehr und mehr vervollständigt.
    Evt. erfolgt vor der endgültigen Übernahme noch eine qualitative Prüfung, das weiß ich nicht.

    Gruß
    Michael Lauffs
    Aachen, Eschweiler, Stolberg

    www.Lauffs.de

    Man sollte eine Dummheit nicht zweimal machen, es gibt doch so viele davon.

  • Hallo Michael,


    wenn ich den Blog-Artikel - siehe posting # 14 - richtig verstanden habe, dann


    - wird nach klick auf den ⟳-Button (war hellgrün, jetzt grau) nur ein neues Captcha angezeigt, evtl für das vorherige Bild eingegebene Daten werden verworfen (das ist für nicht lesbare Bilder gedacht!)
    - eingegebene Daten werden nach klick auf "Suchen" übernommen
    - wenn nicht davor auch ein Suchwort eingegeben wurde, dann erscheint die von Simone beschriebene Fehlermeldung
    - wurde ein Suchwort eingegeben, dann erscheint ein "Danke für die Mithilfe" und das Suchergebnis
    - angezeigte Bilder werden mehrfach bei verschiedenen Usern angezeigt, die übernommene Eingaben werden miteinander verglichen und bei drei identischen Eingaben als richtig fest übernommen.


    Ich werde am Samstag nach Altenberge zum 7. Westfälischen Genealogentag fahren, vielleicht erwische ich da einen, der mir das genau erklären kann.
    Ich werde berichten.

    Freundliche Grüße
    Jörg


    Berlin und Umgebung: Mohr, Hartung, Zienicke, Krusnick, Grünack, Linto (vor 1750); Magdeburger Börde (rund um Egeln, etwa 1600 - 1800)
    Gera: Dix (vor 1740); Wunstorf: Brandes, Steinmann (vor 1800), Hildesheim: Michael (vor 1800); Gönningen (und Umgebung, vor 1650)

  • Hallo,


    ich kann's kurz machen:


    Ich hatte die Gelegenheit mit Jesper darüber zu sprechen, und er hat meine Beschreibung in posting 19 als richtig bestätigt.
    Das ist alles noch in einer Erprobungsphase, mit Änderungen des derzeitigen Zustandes muss man folglich rechnen.

    Freundliche Grüße
    Jörg


    Berlin und Umgebung: Mohr, Hartung, Zienicke, Krusnick, Grünack, Linto (vor 1750); Magdeburger Börde (rund um Egeln, etwa 1600 - 1800)
    Gera: Dix (vor 1740); Wunstorf: Brandes, Steinmann (vor 1800), Hildesheim: Michael (vor 1800); Gönningen (und Umgebung, vor 1650)