Ticket #504 (closed defect: fixed)
Verwerking van ocr data en zoeken
| Reported by: | peter | Owned by: | forgacs |
|---|---|---|---|
| Priority: | major | Milestone: | MediaMosa 3.0 |
| Component: | Support for PDF issue | Version: | |
| Keywords: | Cc: | ||
| MoSCoW: | Must Have | Estimated time after impact analysis: | |
| Related to project: | none | Tested: | no |
| Accepted: | no | Estimated Hours: | 8 |
Description
(dutch text)
Binnen het Archipel project is de ocr-data reeds beschikbaar als xml
bestand, dat apart geupload kan worden. Binnen MediaMosa moet een
mogelijkheid komen om de ocr data in een apart verder niet zichtbaar
metadata veld op te nemen, waarop wel met solr gezocht kan worden.
Bestaande Metadata wordt in een 'longtext' opgeslagen, hetgeen dus
ruim voldoende is om dit soort metadata in op te slaan. We stellen
voor om de aanvullende metadata op te slaan in een extra metadata
definitie (/metadata_tag/create [POST]). Deze metadata-tags zijn mbv
SOLR doorzoekbaar. (Dit is bestaande functionaliteit in MediaMosa 2.3)
De /asset/id [GET] REST-calls geven echter dan wel deze data altijd
terug in (detail) restcalls. Hiertoe stellen we voor bij de
/metadata_tag restcall een parameter 'hidden' (default: false) te
introduceren, zowel bij de /metadata_tag varianten als bij de asset/id
[GET] restcalls.
