Übersetzungshilfe

Sätze und kurze Texte, die korrigiert wurden
Luxdux

Übersetzungshilfe

Beitrag von Luxdux »

Hallo zusammen,
ich bräuchte bitte Hilfe bei der Übersetzung folgender Textstelle - mir wird der genau Sinn nicht ganz klar.

We have obtained a full set of data covering the period from 1th-Oct-2006 until 14-Dec-2010.
We devide the data into twelve parts: each consisting of one year of in-sample data, followed  by three months for out of sample testing.

Also es stehen ins. Daten von 51 Monaten zur Verfügung - aber wie werden die genau aufgeteilt?

Duckduck (Contributor)

Re: Übersetzungshilfe

Beitrag von Duckduck (Contributor) »

Luxdux hat geschrieben:Hallo zusammen,
Hi Luxdux, das ist ja kniffelig und ich bin bestimmt keine Mathe-As-Ente.
ich bräuchte bitte Hilfe bei der Übersetzung folgender Textstelle - mir wird der genau Sinn nicht ganz klar.
Ich bin aber ziemlich sicher, dass es sich nicht so sehr um ein Übersetzungsproblem als einen Tippfehler handelt:

We have obtained a full set of data covering the period from 1th-Oct-2006 until 14-Dec-2010. -> 50,5 Monate
We devide the data into twelve parts: -> 50,5 : 12 = 4,2 whatever
each consisting of one month of in-sample data, followed  by three months for out of sample testing. Das kommt doch so ungefähr mit den oben errechneten 4,2 Monaten aus, oder bin ich auf dem Holzsee? :shock:

Grüße
Duckduck :chief:


Also es stehen ins. Daten von 51 Monaten zur Verfügung - aber wie werden die genau aufgeteilt?

Luxdux

Re: Übersetzungshilfe

Beitrag von Luxdux »

Danke dafür.
So ergibt es schon eher einen Sinn.
Hier einmal der Link, wo das Problem beschrieben ist:

Pdf zur Frage
(Seite 18 unten)

Luxdux

Re: Übersetzungshilfe

Beitrag von Luxdux »

Und wie liese sich in diesem Zusammenhang sinngemäß "out of sample" übersetzen?

tiorthan

Re: Übersetzungshilfe

Beitrag von tiorthan »

Das "out-of-sample" gehört fest in den Begriff "out-of-sample testing", und mir ist keine wirkliche Übersetzung dafür bekannt, wir benutzen eigentlich auch in deutschen Texten den englischen Begriff.

Im Wesentlichen kann man out-of-sample so verstehen, dass man Testphasen hat (Backtesting), die gegen Daten gehen, die nicht in die eigentliche Optimierung einfließen. Man macht das, um sogenanntes curve-fitting zu verhindern, also dass man Überoptimierung gegen einen festen Datensatz verhindert. 

Luxdux

Re: Übersetzungshilfe

Beitrag von Luxdux »

Danke tiorthan.
Hast du dir das pdf einmal angeschaut und kannst mir erklären, wie genau die Daten unterteilt werden.
@Duckduck:
Ich glaube nicht dass es sich hier um einen Schreibfehler (months/year) handelt, da weiter unten im Text steht, dass die 1-Jahr-Testdaten zu kurz sind um eine genaue Aussage zu treffen. Falls es ein Monat wäre, müsste es ja 1-Monat-Testdaten heissen.

Duckduck (Contributor)

Re: Übersetzungshilfe

Beitrag von Duckduck (Contributor) »

Hi Luxdux,

ich frage mich nur, wie man einen Zeitraum von etwas mehr als 4 Jahren in zwölf Teile aufbröselt, die jeweils einen Zeitraum von mehr als 1 Jahr umfassen. :o 
Seltsam ist es auf jeden Fall. Vielleicht durchschaue ich es nicht so recht.

Grüße
Duckduck

P.S. So, jetzt habe ich die Datei mal kurz angeschaut und gebe zu: ich bin vom Thema völlig überfordert. Ich verstehe diese Art von Mathematik und Zeug nicht. Das ist das eine. Aber für die Zukunft, Luxdux, wenn Du solche Sätze gibst, solltest Du kennzeichnen, dass es eine Lücke gibt zwischen dem ersten Satz und dem folgenden. Die dazwischen gegebenen Angaben führen zwar nicht dazu, dass ich besser verstehe, worum es geht, aber es könnte sein, dass in ihren 1000 Testberechnungen jeweils ein Jahr mit den tatsächlich erhobenen Daten gefolgt wird von 3 Monaten, in denen Daten zugrunde gelegt werden, die - da verließen sie mich - irgendwie anders berechnet wurden. (keine Ahnung, wie).

Ich weiß es nicht. Was es auch alles gibt. Aber wenigstens das Eine: Zitieren ist eine Kunst mit gewissen Regeln. Solche Lücken im Zitat sind natürlich zuöässig, werden aber in der Regel mit eckigen Klammern und 3 Punkten darin gekennzeichnet.

Alles Gute
Dd

tiorthan

Re: Übersetzungshilfe

Beitrag von tiorthan »

Luxdux hat geschrieben:Danke tiorthan.
Hast du dir das pdf einmal angeschaut und kannst mir erklären, wie genau die Daten unterteilt werden.
Ich habe es mir angesehen, aber dort steht nichts exaktes über die Aufteilung. Jedoch...
Duckduck hat geschrieben:ich frage mich nur, wie man einen Zeitraum von etwas mehr als 4 Jahren in zwölf Teile aufbröselt, die jeweils einen Zeitraum von mehr als 1 Jahr umfassen. :o
Seltsam ist es auf jeden Fall. Vielleicht durchschaue ich es nicht so recht.
das kann ich erklären ...

Die Aufteilung ist überlappend.

Die Optimierungsmethode, die in dem Paper benutzt wurde nennt sich "walk-forward optimization". Dafür bestimmt man ein Zeitfenster (in dem Beispiel 12 Monate in-sample und 3 Monate out-sample) und führt dafür die Optimierung aus. Dann verschiebt man das Zeitfenster ein klein wenig. Nicht so weit, dass man komplett neue Daten im Zeitfenster hat, sondern man nimmt mit Absicht nur sehr wenige neue Daten hinein und führt eine zweite Optimierungsrunde durch, dann eine dritte usw.

Luxdux

Re: Übersetzungshilfe

Beitrag von Luxdux »

Danke Euch allen!
@tiorthan:
Verstehe ich das so richtig:
Die 3 Monate out-sample data sind quasi die 3 Monate, die man sich selbst berechnet (auf Basis des Optimieralgorithmus und den 12 Monaten in-sample data) und diese 3 Monate werden dann mit dem 3-Monats-Zeitraum der korrespondierenden echten Daten verglichen.

tiorthan

Re: Übersetzungshilfe

Beitrag von tiorthan »

Luxdux hat geschrieben: Die 3 Monate out-sample data sind quasi die 3 Monate, die man sich selbst berechnet
Nein, es handelt sich immer um Originaldaten.

Bei den Daten (sowohl in-sample als auch out-sample) geht es um Eingabedaten für die Formel zur Berechnung des Zimmerpreises.

Im Prinzip funktioniert das Ganze so:

Man hat einen Algorithmus, der mit bestimmten Eingabedaten einen Zimmerpreis berechnet.

Dann nimmt man sich die Daten von 12 Monaten als Trainings-Eingabedaten und passt den Algorithmus so an, dass er einem einen möglichst guten Preis für diesen Zeitraum errechnet.

Das Problem dabei ist, dass man den Algorithmus zu gut auf die Trainingsdaten anpassen kann. Um das zu überprüfen nimmt man sich die Eingabedaten von drei weiteren Monaten, die nicht zu den Trainingsdaten gehören, und man schaut nach, wie gut der Gewinn mit diesen Daten gewesen wäre.

Der Unterschied ist, dass man die Daten für die drei Monate nicht zur Optimierung benutzt, sondern lediglich um Fehler bei der Optimierung festzustellen.