Come raccogliere i dati per l’analisi

In primo luogo, è necessario valutare le seguenti due domande per condurre l’analisi.

  • Di che tipo di dati hai bisogno?
  • Come si può accedere?

Rispondere a queste domande è fondamentale ma non sempre semplice. Naturalmente, una ricerca su Google potrebbe portare a risultati, ma chiedere consigli ai colleghi potrebbe anche essere utile. Trascorri un po ‘ di tempo con queste domande finché non sei sicuro di aver trovato la risposta giusta.,

In uno dei miei progetti, avevo bisogno di accedere ai dati finanziari delle aziende tedesche per analizzare l’effetto di un nuovo standard contabile obbligatorio sugli spread bid-ask.

Fortunatamente, il mio professore ci ha fornito un account Thomson Reuters e ho potuto utilizzare Datastream per accedere ai dati finanziari di queste società. Penseresti che semplicemente usare questo database sarebbe sufficiente e che potrei finalmente fare il vero lavoro.

Falso! Durante la raccolta dei dati per queste aziende, ho finito con 8 diversi fogli Excel che ho dovuto in qualche modo unire in un unico frame di dati.,

Datastream mi ha fornito alcune informazioni aziendali statiche che sarebbero finite come il mio foglio principale.

Gli altri fogli excel che ho ottenuto avevano il seguente formato perché stavo accedendo ai dati delle serie temporali per ogni azienda.

Quindi, come posso ottenere tali dati in un formato significativo in modo da poterlo utilizzare insieme alle altre informazioni aziendali?

Eseguiamo uno dei miei calcoli in modo da ottenere l’idea., Ho avuto due fogli-uno per i prezzi di offerta e uno per chiedere i prezzi. Quello di cui avevo bisogno era lo spread medio relativo bid-ask.

In primo luogo, ho caricato i dati e controllato per i valori mancanti. Ho notato una riga che mancava completamente e l’ho cancellata per entrambi i set di dati.

Quindi ho calcolato lo spread bid-ask sottraendo il prezzo bid dal prezzo ask.

Quindi ho dovuto calcolare lo spread relativo bid-ask., Pertanto, ho dovuto importare i prezzi giornalieri delle azioni, cancellato la 149a riga e calcolato gli spread bid-ask relativi al prezzo.

Infine, ho calcolato la media dei relativi spread bid-ask e l’ho unita nel frame di dati statici.

Questo è solo il codice per una variabile aggiuntiva! Immagina di farlo per 20 o anche 30 altre variabili che non puoi ottenere dal flusso di dati. Questo richiede molto più di 5 minuti.,

Esistono molti altri metodi fattibili su come creare il proprio set di dati da zero. Si potrebbe, ad esempio, condurre un buon vecchio sondaggio o raschiare tweets da Twitter. In definitiva, dipende dal tipo di dati di cui hai bisogno.

Ok, è il momento di una rapida valutazione.

Vantaggi:

  • Le funzionalità sono incluse in base allo scopo della domanda o dell’attività di ricerca. Non viceversa. Questo aiuta a utilizzare solo dati significativi.
  • È tracciabile come sono state create le variabili.

Svantaggi:

Leave a Comment