PDF to (music-) XML Konverter?

  • Ersteller reichenseher
  • Erstellt am
reichenseher
reichenseher
Registrierter Benutzer
Zuletzt hier
22.09.16
Registriert
18.01.05
Beiträge
15
Kekse
0
Hallo,

hat jemand eine Empfehlung für einen guten PDF to XML Konverter. Also ein Tool, dass zuvor eingescannte Noten (in guter Qualität) richtig interpretieren kann und in ein music-XML File umwandelt?
(Also am Ende möchte ich Noten in mein Notion 5 importieren, da funktioniert XML besser als midi)

Hab Stunden mit verschiedensten Lösungen, die man online so findet, verballert, nix hochwertiges dabei.

Würde auch paar Euros investieren wollen.

Danke für Hilfe
 
Eigenschaft
 
ich hasse diese hohlköpfigen Container Formate...
in PDF und XML ist lediglich ein Formalismus beschrieben
der Inhalt kann von Alaska bis auf die Balearen reichen, notfalls ist auch noch Tokyo drin

wundert mich nicht, dass da ein Gefühl von 'Zeit verballert...' zurückbleibt
der Kern der Sache ist das Interpretieren einer Bitmapgrafik als Musik... (vermutlich ein Scan)
eine recht anspruchsvolle Aufgabe - entsprechend wäre ein 'Spezialist' auf dem Gebiet zu empfehlen
das anschliessend als XML zu taggen ist eher sekundär

sorry, dass mir konkret nichts einfällt... ich hatte den Bedarf noch nicht - aber die Fragestellung ist schon interessant

cheers, Tom
 
Ja genau, es geht hier um eine Art Schriftenerkennung, nur dass Noten (und nicht nur Buchstaben und Zahlen) in eine Maschinensprache umgesetzt werden müssen.
Ob die Ursprungsgrafik nun ein übliches Grafikformat oder eine Grafik in einer PDF ist, ist ziemlich wurst.

Die Telekom hat vermutlich Millionen investiert, um möglichst jede Krakelschrift auf einem Brief per Maschine zu lesen.
Spezialisten auf dem Gebiet sind begehrt und werden per Headhunter gejagt - ohne Witz.
Bei einem guten Notendruck ist das natürlich einfacher, die Materie von Noten aber schwieriger.
Deshalb ist es kein Wunder, dass hier Online-Lösungen für umme nichts taugen.

Was ich schon probiert habe und mit viel Nachbearbeitung halbewegs ging ist Capella Scan:
http://www.capella.de/de/index.cfm/produkte/capella-scan/info-capella-scan/
Je nach Vorlage hab ich mich aber auch gefragt, ob es nicht schneller gegangen wäre, das über das Capella-Notationsprogramm selber abzutippen.
MusicXML kann von Capella Scan exportiert werden.
 
das benutze ich auch.

Klappt wunderbar ... solange
  • die Vorlage gut gedruckt ist (handschriftliches geht gar nicht, schlechte Kopie geht schlecht)
  • in jeder Zeile des Systems nur eine einzelne Melodielinie oder Akkord ist; mehrere Stimmen (mit unterschiedlichen Notenlängen) ist ungut
  • die Schlüssel sich auf Violin- und Bassschlüssel beschränken. Tenorschlüssel am Anfang des Systems geht manchmal, innerhalb der Notenzeile erkennt es nicht (ich habe einmal eine Cello-Stimme ins Capella geholt - ein einziges Chaos!)
-> für einfach gestrickte Stücke funktioniert es; wenn diese lang sind, geht es auch schneller als das Von-Hand-Eintippen ...
 
  • Gefällt mir
Reaktionen: 2 Benutzer
ich ergänze:
  • Vorzeichen an einer Note am Zeilenbeginn werden als Tonartwechsel interpretiert :-/
 
Hallo,

ich verwende SmartScore (SC) unter MS Windows zum konvertieren von PDFs/TIFF ins XML Format. Ziel ist u.A. dann GP.

Es gibt eine kostenlose Möglichkeit zum Probieren: die Finale-Testversion (30 Tage Laufzeit) hat eine abgespeckte Version von SC, die auch verwendet werden kann. Allerdings ist der Funktionsumfang eingeschränkt. Es gibt verschiedene Versionen mit unterschiedlichem Funktionsumfang - ja nach Bedarf. Die Preise sind ebenfalls gestaffelt.

In der kommerziellen stand alone Pro- Version, die ich verwende (nach ausführlichen Tests) sind die Ergebnisse überraschend gut. In jedem Fall ist die manuelle Erfassung, mit der ich auch begonnen habe, für mich keine Alternative (mehr), obwohl eine manuelle Korrektur nach dem scan in der Regel nötig ist. Mehrstimmigkeit und Akkoladen mit mehreren Instrumenten sind möglich und werden erkannt. Bearbeiten des Resultats geht auch. Der XML-Export ist unproblematisch.

Die Nutzeroberfläche ist ein wenig gewöhnungsbedürftig, aber deckt (fast) alles ab. Schön ist die gleichzeitige Ansicht der Vorlage (PDF oder TIFF) und des Resultats des Scans. (Vermeintliche) Abweichnungen des Resultats vom Original werden farblich markiert, so daß sehr schnell ein Eindruck von der Qualität des Scans entsteht. Die Korrektur wird dadurch auch wesentlich beschleunigt. Allerdings habe ich öfters festgestellt, daß nicht alle Fehler erkannt werden. Eine Systematik habe ich da noch nicht erkennen können.

Zum XML: Mir scheint, daß ALLE Hersteller der Notensatzprogramme das XML-Format nicht korrekt implementiert haben. Einen "echten" Standard gibt es da wohl nicht. Es ist durchaus üblich dass bestimmte Merkmale/Informationen nicht in das XML exportiert werden oder aber das importierende Programm ein anderes Verständnis über das XML hat. Beispiel: Fingersätze bei Gitarren-Partituren. Es gibt Tags dafür im XML allerdings werden diese beim Export nicht unterstützt oder beim Import einfach nicht importiert. XML ist trotzdem für die Programme, die ich kenne und getestet habe, das einzige brauchbare Format, das programm-übergreifend verwendet werden kann.

Aber als Fazit: Manuell eintippen ist, bei einer entsprechende Menge, keine Alternative. Und die Partitur lernt man beim korrekturlesen nach dem scan immer noch ausreichend kennen ;-))

Grüße
KlaBueBaer
 
XML kann man nicht 'falsch implementieren', dazu ist es zu simpel
gleichzeitig gibt es keinen 'Standard', wie etwas formuliert werden muss
Zusammenhänge können in einer optionalen Document Type Definition (DTD) vereinbart werden
wenn die fehlt, ist alles zwischen Anfangs- und Ende-Marker eine reine Datensammlung
insofern ist der (gern) assoziierte 'Standard' ziehmlich dünnes Eis... ;)
vom Potential her ist es natürlich das flexibelste Format
es lässt sich sehr einfach lesen und ggf funktional erweitern, um Inhalte zu ergänzen oder auch anders auszuwerten
nur sollte man beachten, dass der reine Begriff 'XML' das nicht hergibt - er ist nur der Rahmen - um das Bild darin muss man sich (bzw der Anbieter der Software) selbst kümmern
und genau da gehen die Vorstellungen gern mal auseinander...

cheers, Tom
 
Hi Tom,

danke für Ihre Antwort zum XML. Der Thread geht zwar nicht (nur) über XML sondern eher um die automatisierte Erkennung und Erfassung von (gedruckten) Partituren, und deshalb ist das evtl. OT, aber ich erlaube mir dazu einige Anmerkungen und hoffe, daß dies nicht belehrend wirkt.

> XML kann man nicht 'falsch implementieren', dazu ist es zu simpel

Und ob, "man" kann. ;-)

Geht ganz leicht, wenn gegen Regeln (Syntax) verstossen wird, die hier http://www.w3.org/standards/xml/ spezifiziert sind und den "physischen Aufbau" beschreiben. Das gilt für jede XML-Datei (aka Dokument), unabhängig vom logischen Aufbau. Sie werden kein Dokument (verarbeiten) parsen können, wenn schon diese Syntax nicht eingehalten wird, es sei denn, Sie schreiben den Parser selbst oder parsen auf byte-ebene, aber dann ist es kein XML.

Es stimmt allerdings, die "physische Struktur" von XML ist simpel. Dis Spezifikation umfasst ca 26 Seiten.

> Zusammenhänge können in einer optionalen Document Type Definition (DTD) vereinbart werden

Der "logische" Aufbau (nicht nur Zusammenhänge) eines Dokumentes ist - wie Sie erwähnt haben - mit einer DTD (afaik veraltet) oder einer Schema-Definition (XSD) beschrieben. Wobei eleganterweise das XSD physisch auch wieder XML ist und die Möglichkeiten zur Beschreibung der Struktur die der DTD bei weitem übersteigt.

> wenn die fehlt, ist alles zwischen Anfangs- und Ende-Marker eine reine Datensammlung

Fehlt die Angabe der DTD oder der XSD im Kopf eines Dokumentes, dann handelt es sich strenggenommen nicht um valides XML. btw: jede Datei ist ersteinmal ein Datenfriedhof, wenn die Struktur nicht bekannt ist, insbesondere wenn es sich um binäre Daten handelt. Ein Vorteil von XML gegenüber den meisten anderen Datenformaten ist eben, daß die Beschreibung der Datenstruktur mit dem Dokument verknüpft ist, das sie formalisiert ist und das die Daten und die ElementName/-Attribute gemeinsam mit den Daten in einem Dokument enthalten sind.

> ... er ist nur der Rahmen - um das Bild darin muss man sich (bzw der Anbieter der Software) selbst kümmern ...

Genau das ist nicht die Intention. Der logische Aufbau bzw. die Spezifikation ("das Bild") des XMLs, über das in diesem Thread geschrieben wird, ist im MusicXML Schema beschrieben, das auf http://www.musicxml.com/ zu finden ist. Das ist in diesem Fall herstellerunabhängig, deshalb ist es als Austauschformat geeignet. Darüberhinaus besteht die Möglichkeit der Versionierung einer XSD.

> vom Potential her ist es natürlich das flexibelste Format

ja, es kann logische Inhalte als eine mehr oder weniger hierarchische Baum-Struktur organisieren.

> es lässt sich sehr einfach lesen und

Das bezieht sich sicher darauf, dass XML-Dokumente "plain Text", auch multibyte-Character-Sets, sind, binäre Daten sind direkt nicht verwendbar.
Allerdings gehen die Meinungen der "human" readability nach meiner Erfahrung auseinander. Bei dokumentzentrierten Dokumenten ja, bei datenzentrierten Dokumenten eher nicht. Das dürfte auch der Grund für ähnliche Formate wie z.B. JSON oder YAML sein, die später entstanden sind.

> ggf funktional erweitern,

eher nicht. wobei zu klären ist, was "funktional" in diesem Zusammenhang bedeuten kann.

> um Inhalte zu ergänzen oder

jein. Entweder über eine Versionierung, deshalb enthält die XSD immer eine Versionsnummer. Oder über Namespaces, die allerdings im XSD dann definiert sein müssen.

> auch anders auszuwerten

ja. macht jeder Brower, z.B. siehe (X)HTML, was physisch seit 4.01+ auf XML basiert. Daneben gibt es im XML-Umfeld Werkzeuge, wie z.B. XSL(T) oder XSL-FO.

> ... und genau da gehen die Vorstellungen gern mal auseinander...

Kann sein. aber wenn eine Software als Feature anpreist, MusicXML zu unterstützen, dann ist genau dieser logische Aufbau gemeint, wie er im XSD für eine bestimmte Version festgeklopft ist. Verwendet eine Software ein "eigenes" (proprietäres) Format, das kann jeder Hersteller nach belieben entwerfen, ist dies zum Austausch nicht per se geeignet und ist auch kein MusicXML.

Eine Tatsache ist allerdings, daß die Serialisierung und/oder das Marshalling basierend auf (Music)XML nicht vollständig oder fehlerhaft implementiert ist. Und genau dieser Umstand erfordert noch beim Datenaustausch zwischen unterschiedlichen Programmen eine Kontrolle und evtl. Nachbearbeitung. Was nicht heißen soll, das beim Import von proprietären Formaten (zum Beispiel GP5 in TuxGuitar) nicht auch Fehler entstehen können, weil keine vollständige Implementierung der Spezifikation vorliegt bzw. die Spezifikation nur durch reverse engineering ermittelt werden kann.


Grüße aus Berlin
KlaBueBaer
 
ich kann deinen Ausführungen durchaus folgen... die Mehrheit der Leser vermutlich nicht ;)
deswegen habe ich es auf ein paar Kernsätze heruntergebrochen, die zumindest das Prinzip umreissen

allerdings habe ich Dokument und Parser isoliert betrachtet
wenn beides aus derselben Feder stammt, dann könnte natürlich der Parser so umgesetzt sein, dass er formal 'falsches' XML (für sich) richtig verarbeitet, das Dokument auf anderen Systemen aber nicht mehr sinnvoll lesbar ist...

mit Weiterverarbeitung meinte ich das grundsätzlich einfache Erkennen von Anfang-Inhalt-Ende sowie einer ggf vorhanden Hierarchie
in der Praxis ist es (wie üblich) dann meist nicht ganz so einfach, aber zumindest der Ansatz ist da

cheers, Tom
 

Ähnliche Themen


Unser weiteres Online-Angebot:
Bassic.de · Deejayforum.de · Sequencer.de · Clavio.de · Guitarworld.de · Recording.de

Musiker-Board Logo
Zurück
Oben