200128
Giellateknomöte 28.1. 
Saker
- Korp og marisk 
 - Logger 
 - EuroPython konferanse 
 - git
 
Korp og marisk
OCR-lesing
Problemet med mellomrom ligg i convert2xml, dvs. i pdftotext. Vi diskuterer med Børre, og ser også på spalte-spørsmålet.
Referansefil:
orig/mhr/news/proletar_kultur_verch/proletar_kul_tur_verch_1936_1-2.pdf
Spørsmålet om mellomrom som uthenving kjem etterpå.
Vi diskuterer konvertering med Børre. Trond diskuterer med Jeremy om kven som kan arbeide med å redigere xsl-filer.
Analyse
Problemet med tekst etter : har Chiara allereie ordna.
Trond har lagt til alle (!) uanalyserte teikn i symbols.lexc. Trond ser på om nokre av dei kan fjernast (i lag med Sjur).
Logger
Sjå oversikt i dokumentet GTHOME/art/2020/digitools/loggoversikt.txt
NDS
user_log
Fra starten: 
Fra 2016-01 har vi også dato og ip adresse: 
access.NDS_NAVN.log:
OAHPA
Cgi-bin
Det finnes ingen logg på serveren (har også prøvde å lete i dokumentasjonen men fant ingenting)
NGINX log (som kan da brukes på forskjellige måter)
Mulig strategi: 
Prinsipp:
- systemet må vere automatisk, robust over tid (utan at disken går full), og robust mot datatap
 
EuroPython konferanse
2020 konferanse 
git
Sjur vil prioritere dette.

