Sunday 6 August 2017

Differenziazione Dati Di Serie Temporali Nel Forex Stata


Per domande brevi e-mail dataprinceton. edu. Nessun pony. necessaria durante ore walk-in. Nota: il laboratorio DSS è aperto fintanto che Firestone è aperta, nessun appuntamento necessario utilizzare il computer del laboratorio per la propria analisi. Tempo serie di dati in Stata tempo dati serie e tsset Per utilizzare le funzioni di serie temporali Statas e analisi, è necessario innanzitutto fare in modo che i suoi dati sono, infatti, di serie temporali. In primo luogo, è necessario disporre di una variabile data che è in Stata formato della data. In secondo luogo, è necessario assicurarsi che i suoi dati sono ordinati per questa variabile data. Se si dispone di dati panel, quindi i dati devono essere ordinati per la variabile data entro la variabile che identifica il pannello. Infine, è necessario utilizzare il comando tsset per dire Stata che i dati sono di serie temporali: Il primo esempio dice Stata che si dispone di dati semplici di serie temporali, e la seconda dice Stata di avere dati panel. Stata Data Format negozi Stata date come il numero di giorni trascorsi dal 1 ° gennaio 1960. Ci sono modi diversi per creare date Stata trascorsi che dipendono da come le date sono rappresentati nei dati. Se l'insieme di dati originale contiene già una singola variabile data, quindi utilizzare la funzione data () o uno degli altri comandi stringa data. Se si dispone di variabili separate memorizzazione diverse parti della data (mese, giorno e anno anno e trimestre, ecc), allora si avrà bisogno di utilizzare le funzioni di variabili di data parziale. funzioni di data per una singola variabile di data stringa A volte, i dati avranno le date in formato stringa. (Una variabile stringa è semplicemente una variabile che contiene qualcosa di diverso da semplici numeri.) Stata fornisce un modo per convertire questi per le date di serie temporali. La prima cosa che dovete sapere è che la stringa deve essere facilmente separato nelle sue componenti. In altre parole, le stringhe come 01feb1990 1 febbraio 1990 020.190 sono accettabili, ma non è 020.190. Ad esempio, supponiamo di avere una sDate variabile stringa con valori come 01feb1990 ed è necessario convertirlo in un giorno date serie temporale: Si noti che in questa funzione, come con le altre funzioni per convertire stringhe in date di serie temporali, la porzione DMY indica l'ordine del giorno, mese e l'anno nella variabile. Erano i valori state codificate come 1 febbraio 1990 avremmo usato MDY, invece. Che cosa succede se la data originale ha solo due cifre per l'anno quindi dovremo usare: Ogni volta che avete anni a due cifre, è sufficiente posizionare il secolo prima della Y. Se si dispone degli ultimi due anni cifre mescolati, come ad esempio il 1298 e il 1200, l'uso: dove 2020 è l'anno più grande che avete nel vostro set di dati. Qui ci sono le altre funzioni: settimanale (StringVar, WY) mensile (StringVar, il mio) trimestrale (StringVar, QY) halfyearly (StringVar, HY) annuale (StringVar, y) Nota: Stata 10 utilizza lettere maiuscole come DMY mentre la versione precedente di Stata utilizza minuscolo, DMY. funzioni di data per le variabili di data parziali Spesso si avrà variabili distinte per i vari componenti della data è necessario mettere insieme prima di poterli designare come corrette le date di serie temporali. Stata fornisce un modo semplice per fare questo con le variabili numeriche. Se si dispone di variabili separate per mese, giorno e anno quindi utilizzare la funzione MDY () per creare una variabile data trascorso. Dopo aver creato una variabile data trascorso, probabilmente si desidera formattarlo, come descritto di seguito. Utilizzare la funzione MDY () per creare una variabile data Stata trascorso quando i dati originale contiene variabili distinte per mese, giorno e anno. Le variabili mese, giorno e anno devono essere numerici. Ad esempio, supponiamo che si sta lavorando con questi dati: La conversione di una variabile data memorizzata come un unico numero Se si dispone di una variabile di data in cui la data è memorizzato come un singolo numero della forma yyyymmdd (ad esempio, 20.041.231 per il 31 dicembre 2004) la seguente serie di funzioni convertirà in una data Stata trascorso. gen anno int (date10000) gen mese int ((data-year10000) 100) Gen giorno int ((data-year10000-mensili100)) gen MyDate MDY (mese, giorno, anno) formati di data formato mydate d serie Tempo Utilizzare il comando format per visualizzare le date Stata trascorsi come date di calendario. Nell'esempio di cui sopra, la variabile di data trascorso, MyDate, ha i seguenti valori, che rappresentano il numero di giorni prima o dopo il 1 gennaio 1960. Per ulteriori informazioni consultare la Guida per l'utente Stata, capitolo 27. Specificando date Spesso abbiamo bisogno di consuct una particolare analisi solo su osservazioni che cadono in una certa data. Per fare questo, dobbiamo utilizzare qualcosa che si chiama una data letterale. Una data letterale è semplicemente un modo di entrare in una data a parole e hanno Stata convertire automaticamente ad una data trascorso. Come con il D () letterale per specificare una data regolare, ci sono il w (), m (), q (), h () e Y () letterali per l'inserimento settimanale, mensile, trimestrale, semestrale, e date annuali, rispettivamente. Ecco alcuni esempi: Se si desidera specificare un intervallo di date, è possibile utilizzare la latta () e twithin () funzioni: La differenza tra stagno () e twithin () è che lo stagno () comprende l'inizio e di fine, mentre twithin () li esclude. Inserire sempre la data di inizio prima, e scrivere come si farebbe per qualsiasi d (), w (), ecc funzioni. Time Series elenchi di variabili Spesso nella serie temporale analizza dobbiamo lag o determinare i valori di una variabile da un'osservazione all'altra. Se abbiamo molte variabili, questo può essere ingombrante, soprattutto se abbiamo bisogno di essere in ritardo di una variabile più di una volta. In Stata, siamo in grado di specificare quali variabili devono essere ritardato e quante volte, senza dover creare nuove variabili, quindi risparmiando un sacco di spazio su disco e di memoria. Si dovrebbe notare che il comando tsset deve essere stato rilasciato prima di tutti i trucchi di questa sezione funzionerà. Inoltre, se hai definito i dati come dati panel, Stata automaticamente ri-iniziare i calcoli come si tratta dell'inizio di un pannello in modo che non è necessario preoccuparsi di valori da un pannello in corso al prossimo. L. varname e F. varname Se avete bisogno di essere in ritardo o di condurre una variabile per l'analisi, è possibile farlo utilizzando il L. varname (ad essere in ritardo) e F. varname (al piombo). Entrambi funzionano allo stesso modo, così bene solo mostrare alcuni esempi con L. varname. Diciamo che si desidera a regredire questo anni sul reddito dell'ultimo anno di reddito: sarebbe raggiungere questo obiettivo. La L. dice Stata ad essere in ritardo reddito di un periodo di tempo. Se si voleva essere in ritardo reddito da più di un periodo di tempo, si dovrebbe semplicemente cambiare il L. a qualcosa come L2. o L3. a restare entro 2 e 3 periodi di tempo, rispettivamente. I due comandi seguenti si producono gli stessi risultati: Un'altra scorciatoia utile è D. varname, che prende la differenza di reddito nel tempo 1 e del reddito nel tempo 2. Ad esempio, consente di dire una persona ha guadagnato 20 ieri e 30 stazionarietà today. Statistical: una serie temporale stazionaria è uno cui proprietà quali la media, la varianza, autocorrelazione, ecc statistica sono tutti costanti nel tempo. La maggior parte dei metodi di previsione statistica si basano sul presupposto che la serie temporale può essere reso circa stazionaria (cioè quotstationarizedquot) attraverso l'uso di trasformazioni matematiche. Una serie stationarized è relativamente facile da prevedere: è sufficiente prevedere che le sue proprietà statistiche saranno lo stesso in futuro, come lo sono stati in passato (Ricordiamo le nostre citazioni famose di previsione.) Le previsioni per la serie stationarized possono poi essere quotuntransformed, quot invertendo qualunque trasformazioni matematiche sono stati precedentemente utilizzati, per ottenere previsioni per la serie originale. (I dettagli sono normalmente curati dal software.) Così, trovando la sequenza delle trasformazioni necessarie per stationarize una serie temporale spesso fornisce indizi importanti nella ricerca di un modello di previsione adeguata. Stationarizing una serie storica attraverso la differenziazione (dove necessario) è una parte importante del processo di montaggio di un modello ARIMA. come discusso nelle pagine ARIMA di queste note. Un altro motivo per cercare di stationarize una serie temporale è quello di essere in grado di ottenere statistiche campione significativo, quali mezzi, varianze e correlazioni con altre variabili. Tali statistiche sono utili come descrittori di comportamento futuro solo se la serie è fermo. Ad esempio, se la serie è costantemente in aumento nel tempo, la media e varianza campionaria crescerà con la dimensione del campione, e saranno sempre sottovalutare la media e la varianza in periodi futuri. E se la media e la varianza di una serie non sono ben definiti, quindi non sono le sue correlazioni con altre variabili. Per questo motivo si dovrebbe essere cauti nel cercare di estrapolare modelli di regressione ai dati non stazionari. La maggior parte di business e serie storiche economiche sono tutt'altro che ferma quando espressi nelle loro unità originali di misura, e anche dopo aggiustamento deflazione o stagionale sono in genere ancora mostrano le tendenze, cicli, random-piedi, e altri comportamenti non stazionario. Se la serie ha una tendenza di lungo periodo stabile e tende a ripristinare la linea di tendenza segue un disturbo, può essere possibile stationarize dal de-trend (ad esempio fissando una linea di tendenza e sottraendo fuori prima di montare un modello, oppure includendo l'indice di tempo come variabile indipendente in una regressione o un modello ARIMA), forse in concomitanza con la registrazione o sgonfiando. Tale serie è detto di essere trend-stazionaria. Tuttavia, a volte anche de-trend non è sufficiente a rendere fermo serie, nel qual caso può essere necessario trasformarlo in una serie di differenze eo stagione a stagione periodo a periodo. Se la media, varianza e autocorrelazioni della serie originale non sono costanti nel tempo, anche dopo l'eliminazione del trend, forse le statistiche dei cambiamenti della serie tra i periodi o tra le stagioni sarà costante. Una tale serie si dice che sia la differenza-stazionaria. (A volte può essere difficile capire la differenza tra una serie che è tendenza stazionaria e uno che è la differenza-stazionario, e un cosiddetto test di radice di unità può essere utilizzata per ottenere una risposta più definitiva. Torneremo su questo argomento più avanti nel corso.) (Torna a inizio pagina.) la prima differenza di una serie storica è la serie di modifiche da un periodo all'altro. Se Y t indica il valore della serie temporale Y al periodo t, allora la prima differenza di Y al periodo t è uguale a Y t - Y t-1. In Statgraphics, la prima differenza di Y è espresso come DIFF (Y), in RegressIt è YDIFF1. Se la prima differenza di Y è fermo e anche completamente casuale (non autocorrelato), allora Y è descritto da un modello casuale: ogni valore è un passo a caso dal valore precedente. Se la prima differenza di Y è fermo ma non del tutto casuale - i. e. se il suo valore al periodo t è autocorrelato con il suo valore in periodi precedenti - poi un più sofisticato modello di previsione, come livellamento esponenziale o ARIMA può essere opportuno. (Nota: se DIFF (Y) è fermo e casuale, questo indica che un modello random walk è appropriato per la serie originale Y, non è che un modello random walk deve essere montato su DIFF (Y) Montaggio un modello random walk a Y. è logicamente equivalente a montare una media del modello (costante solo) a DIFF (Y).) Ecco un grafico della prima differenza del AUTOSALECPI, il sgonfio serie vendite di auto. Notare che ora sembra approssimativamente stazionaria (almeno media e varianza sono più o meno costante) ma non è affatto casuale (un modello stagionale rimane): La seguente foglio illustra come la prima differenza viene calcolato per il sgonfiato dati vendite di auto:

No comments:

Post a Comment