Interne Datenbank vs. MySQL

Anworten auf häufig gestellte Fragen zur Loganalyse mit Sawmill Analytics.
Antworten
Benutzeravatar
Support
Site Admin
Beiträge: 3102
Registriert: 5. Apr 2003 14:21
Betriebssystem: Windows 7 & 10
Produkt: DOpus 11/12, R-Studio 8, Sawmill 8, RDI 6, MindGenius 6
Version DOpus: Pro
Wohnort: Frankfurt
Kontaktdaten:

Interne Datenbank vs. MySQL

Beitrag von Support » 13. Feb 2006 13:40

Geschwindigkeit
Die interne Datenbank wurde speziell für Samwill entwickelt und optimiert, daher ist sie etwa um den Faktor 2 schneller als eine MySQL-Datenbank.

Warum MySQL
* MySQL ist dann die Datenbank der Wahl, wenn man mit anderen Programmen auf die Daten zugreifen möchte.
* Ein weiterer Grund für MySQL ist, dass die Datenbank erheblich weniger Speicherplatz verbraucht als die interne Datenbank. Gerade auf 32-Bit Systemen kann dies ein entscheidender Grund sein.
* Auch der RAM-Bedarf von MySQL liegt deutlich unter dem der internen Datenbank. (Gilt nicht für MySQL-Cluster, die die gesamte Datenbank im RAM halten!)

Sehr große Datenbestände
Bei sehr großen Datenbeständen kann bei der Enterprise-Version von Samwill ein MySQL-Cluster verwendet werden.

Soll alles jedoch auf einem Computer ausgewertet werden, so kommt hier wieder die interne Datenbank ins Spiel. Verwendet man nämlich eine 64-Bit Hardware mit 4 GB oder mehr RAM und einem 64-Bit Betriebssystem, dann kann die interne Datenbank praktisch unbegrenzt große Datenmengen verarbeiten. Der RAM-Bedarf ist dabei allerdings sehr hoch.

Alternativ zum MySQL-Cluster, dessen Kosten schnell in die Höhe steigen können, kann man auch die interne Datenbank für den Aufbau eines Clusters verwenden. Hierbei wird die Datenbankerstellung auf N Computer aufgeteilt. Die einzelnen Datenbanken werden dann von Sawmill zusammengefügt (Enterprise-Version). Hierzu ist etwas Scripting notwendig, was jedoch nicht besonders schwierig ist.

Zusammenfassung
Es empfiehlt sich, primär die interne Datenbank zu verwenden. Erst bei sehr großen Datenbeständen, muss man sich weitere Gedanken machen. Der Einsatz einer 64-Bit Hardware mit einem 64-Bit Betriebssystem und mindestens 4 GB RAM sind eine empfohlende Konfiguration für die schnelle Verarbeitung großer bis sehr großer Datenmengen.

Nur wenn die Daten extern über SQL abgefragt werden sollen, ist der Einsatz von MySQL unumgänglich.

Hinweis: Immer wieder werden wir gefragt, aber wann denn die Datenmenge groß ist und Grenzen erreicht werden. Durch die Vielfalt der Formate und den unterschiedlichen Inhalt kann man aber nur schwer einen treffenden Wert nennen. Die Erfahrung zeigt jedoch, das 100GB unkomprimierte Logdaten oft eine Grenze darstellen. Darüber wird der Adressbereich auf 32-Bit-System ein Thema und man erhält Speicherfehler. Dies ist aber, wie erwähnt, nur ein Richtwert. Es kann unter ungünstigen Umständen auch schon darunter zu Problemen kommen oder mit 10 TB noch funktionieren.

Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 2 Gäste