Sunday, September 21. 2008M-BOX Karteikartenliste wird flexibel
Neues Feature demnächst: die Anwender/innen legen selbst fest, welche Informationen in der Karteikartenliste angezeigt werden.
Bis dato sieht die Karteikartenliste so aus: Screenshot der Karteikartenliste bis inkl Version 4.1.4 (Sept. 2008) Die Spalten sind fix vorgegeben, die Breite kann mit den Schaltflächen in der Überschrift frei eingestellt werden. M-BOX merkt sich auch die letzte Einstellung. Flexibilität ist insofern gegeben, dass die Spalten für Primärinformation, Sekundärinformation und Tertiärinformation jene Daten enthalten, welche in den entsprechenden Feldern vorhanden sind. Und welches Feld ein Primär-, Sekundär- oder Tertiärfeld ist, wird in der Musterkarte von den Anwender/innen selbst definiert. Problem 1: Wenn man ein anderes Feld als bisher in der Liste sehen möchte, ist die Umdefinition in der Musterkarte, welches Feld beispielsweise als Tertiärfeld gelten soll, mühsam und meist einer kleinen Gruppe von M-BOX Administrator/innen vorbehalten. D.h. die 'normalen' Anwender/innen haben keine realistische Chance, schnell einmal ein anderes Feld in der Karteikartenliste zu sehen zu bekommen. Problem 2: Die Anzahl der Spalten ist sehr begrenzt. Ein zusätzliches viertes oder gar fünftes Textfeld ist derzeit nicht vorgesehen. Problem 3: Suchbegriffe aus der Karteikarte können gar nicht in der Liste aufscheinen. Das Gleiche gilt für Bestände oder die Information, ob Zusatzkarten vorhanden sind. Erfreulicherweise gibt es seit Version 4 immerhin ein Symbol dafür, ob die Karteikarte Medien hat oder nicht. Die Lösung Wir erweitern die Karteikartenliste auf bis zu 15 Spalten. Das sollte reichen Was in den einzelnen Spalten steht und in welcher Reihenfolge die Spalten gezeigt werden, bestimmt jede/r Anwender/in selbst. Die Einstellung wird für jede/n Benutzer/in bei Programmende automatisch gespeichert. Beim nächsten Start sieht die Liste wieder so aus wie zuletzt eingestellt. Wie wird definiert, was wo steht? Im neuen Kontextmenü der Karteikartenliste (ja, so eines hat es bisher noch gar nicht gegeben) gibt es zwei Menüpunkte: Spalte einfügen und Spalte entfernen. Dort werden dann die verfügbaren Felder aufgelistet und können so als weitere Spalte ganz hinten angefügt werden oder eben entfernt werden. Die Reihenfolge der Spalten wird durch Klicken und Verschieben der Schaltflächen bei den Spaltenüberschriften festgelegt. Zusätzlich zu den bisher bereits angezeigten Informationen stehen zur Verfügung:
So kann die neue Karteikartenliste aussehen: Screenshot der Karteikartenliste ab Version 4.2 Defined tags for this entry: benutzerdefiniert, entwicklung, feature, flexibilität, karteikartenliste
Wednesday, September 10. 2008Volltextindex für PDF Dokumente
Probleme bei Indexierung von PDF Dokumenten für die Volltextsuche. Erstellen Sie deshalb alle Ihre PDF-Dokumente im Format PDF/A-1a.
Wir beschäftigen uns gerade mit dem Thema Volltextindexierung für PDF und MS-Office Dokumente. Dabei stoßen wir im Bereich PDF auf unerwartete Probleme. PDF wehrt sich nämlich ein bisschen. Details und Links zu PDF gibt's in der Wikipedia. M-BOX verwaltet u.a. PDFs. Gelegentlich wird von Kunden der Wunsch geäußert, dass diese Dokumente nicht nur verwaltet werden, sondern dass es möglich sein soll, nach den Inhalten dieser Dokumente zu suchen - eine Volltextsuche in den PDFs und MS-Office Dokumenten. Derzeit recherchieren wir, welche Programmbibliotheken verfügbar sind, um aus diesen Dokumenten den reinen Text herauszuholen, damit M-BOX dann daraus einen Index basteln kann. Bei den Tests sind wir auf folgende Problematik gestossen: Bei einem Teil der PDF Dokumente werden einige wenige Worte aus dem Text nicht als Worte extrahiert, sondern als mehr oder weniger wirre Buchstabenkombinationen. Das PDF Dokument enthält beispielsweise den Text 'Der Mann geht zum Brunnen'. Extrahiert wird aber: 'Der Mann geht zum B Br ru un ne en n'. Irgendwie erinnert mich das an das bei Kindern beliebte Sprachspiel, wo jeder Vokal verdoppelt wird und ein b oder ein l eingefügt wird - aus Postamt wird dann Polostalamt. Im obigen Beispiel ist 'Brunnen' mit etwas Mühe und gutem Willen beim Lesen noch erkennbar, für einen Index ist dieser Buchstabensalat aber nicht brauchbar. Wenn ein/e Benutzer/in nach 'Brunnen' suchen würde, würde er/sie dieses Dokument nie finden. Auch wenn nur ein kleiner Teil der PDF Dokumente und darin nur wenige Worte betroffen sind, schafft diese Situation doch enorme Unsicherheit. Man kann sich nicht darauf verlassen, dass bei einer Suche wirklich alle Dokumente mit dem gesuchten Begriff gefunden werden. Das Problem mit dem Buchstabensalat entsteht, weil PDF nicht garantiert, dass der Text in vom Menschen lesbarer Form extrahiert werden kann. PDF ist in erster Linie ein Standard, der dafür sorgt, dass ein PDF Dokument auf verschiedenen Computern ohne die Software, mit der das Dokument ursprünglich erzeugt wurde, angesehen und ausgedruckt werden kann. Es ist ein Format, das sich zuerst ums Layout kümmert. Es geht um die Wiedergabe des Dokuments, nicht um den Inhalt. Die Lösung des Problems: Die archivsichere Variante von PDF: PDF/A-1a - Details wieder bei Wikipedia oder bei der Gesellschaft für Digitale Dokumentenstandards. PDF-Dokumente, welche mit dem Standard PDF/A-1a erzeugt wurden, enthalten den Text in menschlich lesbarer Form. Diese Dokumente können von M-BOX verlässlich gesucht werden. Deshalb ist sehr zu empfehlen, alle PDF-Dokumente mit dem PDF/a-1a Standard zu erzeugen. Ok, wenn das erzeugte Dokument nicht aufbewahrt werden soll, sondern nur kurzzeitig verwendet wird, dann braucht man sich darum nicht zu sorgen. Wie kann man PDF-Dokumente mit dem PDF/a-1a Standard erzeugen? Bei der o.a. Quelle werden Adobe Acrobat Professional ab Version 8 und MS-Office 2007 genannt. Wir werden das hier bei uns verifizieren und schauen, ob es noch weitere interessante Werkzeuge dafür gibt. Thursday, September 4. 2008Bildbearbeitung zwischen Optimierung und Fälschung
In Ausgabe 18 der c't vom 18.8.2008 sind auf Seite 148-156 zwei Artikel zum Thema Bildbearbeitung zwischen Optimierung und Fälschung sowie über Verfahren zur Erkennung von Bildfälschungen zu finden. Sehr empfehlenswert! (Logisch, sonst würd ich's hier ja nicht herschreiben).
Am 31. Oktober eröffnet im liechtensteinischen Landesmuseum Vaduz die Wanderausstellung Bilder, die lügen. Klingt, als ob diese Ausstellung einen Besuch wert wäre. Auf der Homepage von Glenn Feron sieht man, wie in der Werbebranche retuschiert wird. Genial! Der Mann beherrscht sein Werkzeug. Man fragt sich, wozu man überhaupt noch fotografiert, das ist eh alles beliebig montierbar. Tipp: MouseOver über den Bildern zeigt das Bild vor der Retusche. Beeindruckend auch, dass GEO keine retuschierten Fotos veröffentlicht. Steht jedenfalls im c't Artikel. Thursday, September 4. 2008RTFM
Two hours of trial and error can save ten minutes of manual reading.
gefunden in der Signatur von 'Enigma', domainfactory Forenexperte
(Page 1 of 1, totaling 4 entries)
|
M-BOX WebsiteQuicksearchKategorienTags album anwendung archiv archivnummer ausstellung benutzerdefiniert bildbearbeitung diaschau digitale medien dokumentation entwicklung export feature fälschung geschwindigkeit health check homepage hühner interna karteikartenliste logbuch mappe massenbearbeitung off topic performance pin-code power-edit release retusche stempel suche tipps und tricks update version volltextsuche wasserzeichen website weiterverwendung wiedervorlageBlog abonnierenBlog Administration |

