Skip to content
marians edited this page Mar 24, 2013 · 7 revisions

Die Stadt Köln wird in Kürze (etwa Ostern 2013) ihre SessionNet-Installation auf Version 4.4.3 aktualisieren. Damit ändern sich sämtliche Ausgabeseiten (Templates). Hier werden die Auswirkungen beschrieben und Ansätze, wie damit umgegangen werden kann.

Die gute Nachricht: Da in Köln künftig Standard-Templates von Somacos verwendet werden, sollte der Scraper ohne nennenswerte Anpassungen auch in vielen anderen Kommunen nutzbar sein.

Als Vorlage für das zukünftige System verwenden wir hier Mannheim [http://buergerinfo.mannheim.de/buergerinfo/infobi.asp] oder Ulmen [https://sessionnet.krz.de/ulmen/bi/infobi.asp].

Seitentypen

Folgende Seitentypen werden aktuell gescraped und sind betroffen:

Darüber hinaus kommt eventuell folgender Seitentyp neu hinzu, wenn dieser in Köln tatsächlich genutzt wird (in Mannheim existiert er nicht):

Änderungen an Seitentypen

An allen Seitentypen sind einfache HTML-Änderungen zu berücksichtigen. Nachfolgend werden Änderungen beschrieben, die noch darüber hinaus gehen.

Sitzungskalender

Keine wesentlichen Änderungen

Sitzungs-Detailseite

Änderung am Abruf von sitzungsbezogenen Dateianhängen. Siehe weiter unten, "Abruf von Dateiannhängen".

Vorlagen-Detailseite

Gegenüber der aktuellen Version sind hier bei der Installation in Ulmen weitere Felder in der Ausgabe enthalten, die umfangreiche Informationen mit HTML-Auszeichnungen enthalten. Je nach Vorlagentyp wird nur ein Teil der Felder belegt.

  • Beschlussvorschlag
  • Sachverhalt
  • Haushaltsrechtliche Beurteilung

Darüber hinaus ändert sich der Abruf von Datei-Anhängen. Siehe weiter unten, "Abruf von Dateiannhängen".

Tagesordnungspunkt-Detailseite.

Dieser Seitentyp ist neu. Die auf der Seite angezeigten Informationen sind aktuell noch gar nicht zu bekommen oder sind nur in PDF-Dokumenten enthalten. Dazu gehören:

  • Beschluss-Ergebnis, z.B. "einstimmig beschlossen"
  • Abstimmungsergebnis, z.B. "Ja: 19, Nein: 0, Enthaltungen: 0, Befangen: 0"
  • Beschlusstext, z.B. "Der Verbandsgemeinderat beschließt, mit der Stadt Ulmen und den Ortsgemeinden eine Anstalt des öffentlichen Rechts (AöR) zur Wahrung und Sicherung ..."
  • Sachverhalt: ausführliche Beschreibung des Themas einschließlich Rich Text bzw. HTML mit Tabellen und ähnlichem.

Abruf von Dateiannhängen

Bisher wurden in den HTML-Templates in den name-Attributen der Anhang-Download-Formulare die numerischen IDs der Anhänge ausgegeben. Beispiel:

<form class="smcdoccontrol1" action="ydocstart.asp" method="post" target="_blank" name="pdf397095">
    ....
</form>

Diese ID wird in unseren Datenbank-Tabellen als Primärschlüssel verwendet und dient auf Offenes Köln als maßgeblicher Teil der URL des Dateianhangs.

In den neuen Templates sind diese IDs nicht mehr vorhanden. Ein beispielhaftes Download-Formular eines Dateianhangs sieht nun so aus:

<form action="getfile.asp" method="post" target="_blank">
    <input type="hidden" name="DO" value="822717715948677946470839394986224534540762428771765402192836050733774858">
    <input type="hidden" name="DT" value="Verbandsgemeinderat_Ulmen_19_12_2012_Oeffentliche_Bekanntmachung_VG">
    <input type="hidden" name="CLIENT" value="90">
    <input type="hidden" name="DEN" value="pdf">
    <input type="hidden" name="LO" value="">
    <input type="hidden" name="s1" value="199271978">
    <input type="hidden" name="s2" value="778647256">
    <input type="hidden" name="s3" value="787942467">
    <input type="hidden" name="s4" value="296937657">
    <input type="hidden" name="type" value="do">
    <input class="smcimg16" type="image" name="_submit" src="im/pdf.gif" alt="Dokument anzeigen: Öffentliche Bekanntmachung VG&nbsp;Dateigrösse: 190&nbsp;KB " title="Dokument anzeigen: Öffentliche Bekanntmachung VG&nbsp;Dateigrösse: 190&nbsp;KB ">
</form>

Das einzige Feld, das hier offenbar einen unveränderlichen Wert enthält, ist "DT". Die Werte der anderen Felder ändern von Session zu Session bzw. von Nutzer zu Nutzer ihren Wert.

Tatsächlich scheint der Wert des DT-Feldes systemweit eindeutig zu sein, so dass dieses Feld in Zukunft als Primärschlüssel für Anhänge verwendet werden könnte. Der Wert dieses Feldes ist sichtbar vom Inhalt des Anhangs abhängig.

Verbandsgemeinderat_Ulmen_19_12_2012_Oeffentliche_Bekanntmachung_VG

Es ist noch zu prüfen, ob sich dieser String ändern kann, wenn beispielsweise der Titel eines Anhangs angepasst wird.