SE - Ikonky OCR #35
Labels
No Label
app-basic
app-ckan
app-crisiscleanup
app-cts
app-decidim
app-dhis2
app-frontlinesms
app-gnuhealth
app-kanboard
app-mifosx
app-motech
app-odoo
app-opendatakit
app-pandora
app-sahana
app-seeddms
app-sigmah
app-taarifa
app-ushahidi
critical
CZ
documentation
Doing
enhancement
GMaps
info
Mapbox
needinfo
new-app
OSM
performance
QGIS
regression
suggestion
To Do
upstream
No Milestone
No project
No Assignees
1 Participants
Notifications
Due Date
No due date set.
Dependencies
No dependencies set.
Reference: Spotter-Cluster/Spotter-VM#35
Loading…
Reference in New Issue
Block a user
No description provided.
Delete Branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
funkčnost OCR sice byla zadána v settingu, kód k tomu patrně není běžně k dispozici. Myslím, že se tim zabývali někde v Asii, ale neviděl jsem z toho vůbec nic.
Takže pokud to je zas další bábovička na pískovišti a hrad si musíme postavit sami, tak to momentálně odložme na neurčito a ty malé ikony na každé straně se můžou odstranit. (setting?)
Zkuste to OCR teď. Sice je hned na začátku jeho kódu velké tlusté varování
nicméně jednoduchým doplněním jakési ladící hodnoty se mi jej podařilo donutit alespoň nabízet formuláře ke stažení a vyplnění. Otestování, zda je modul schopen číst i vyplněná data zatím nechám na Vás. Samozřejmě PDFka nepodporují diakritiku, protože řez písma se nebere z nastavení jako u exportů, ale je napevno nastaven asi na dvaceti místech. Navíc ještě do hry vstupuje i metrika fontu, takže není tak úplně jednoduché jej přepláncout jiným, ale v případě, že by o funkci stále byl zájem se o to mohu pokusit.
aha.. zajímavé, díky.. PDF se vyrobilo. tak to určitě ještě zkuste s tím fontem, a pokud je něco, s čím by se dalo otravovat na Githubu, tak neváhejte
Může být i nějaký monospace font.
ještě než se do toho pustíte, já se zkusím zorientovat co konkrétně mi to může nabídnout.
Modul Projects - Otevřít úlohy pro Projekt
https://dasm.dasm.cz:8443/eden/project/project
https://dasm.dasm.cz:8443/eden/project/project/create.pdf
`{"status": "failed", "message": "NOT IMPLEMENTED", "statuscode": "501"}
Modul Warehouses - Inventory
https://dasm.dasm.cz:8443/eden/inv/recv/create.pdf
{"status": "failed", "message": "INTERNAL SERVER ERROR", "statuscode": "500"}
takových situací na různých stranách tam bude asi víc, vypadá to že to je hodně opuštěné.
Takže jaký je konečný verdikt? Opravit češtinu a nechat na programátora nebo vypnout?
Podpory shora se tu celkem určitě nedočkáme, maximálně nám řeknou, že jim můžeme pomoct to OCR přepsat. Mimoto koukám na ty PDF a zjišťuji, že jim vlastně moc nerozumím. Zdá se, že obsahují naprosto všechna pole, bez nějaké očividné struktury. Pokud by měl polní pracovník ke každé evidované osobě vyplnit 26stránkový formulář tak, jak jej generuje Sahana, u třetího člověka spáchá propiskou seppuku.
Já na to taky pak včera koukal, a mám z toho podobný pocit. Je to takový levný pokus o OCR postup. Nevyzkoušel jsem vyplnění a import, protože nemám tiskárnu a skener doma. Pravděpodobně tedy OCR uložíme k ledu, ikonky vypnout a zůstane nám info v jakém to je stavu.
Díky za tuhle informaci... nikdo jiný by mi ji nezprostředkoval.
closed via commit
99e00e07d4
changed milestone to %2