Det er noen problemer med Emigrantprotokllene som bør nevnes. Det er hyppige eksempler på at felter har "feil" innhold. Med det mener jeg at innholdet i en celle enten er forskøvet fra en annen celle, eller at det er blitt skrevet inn feil innhold. Dette har jeg noen ganger klart å orden ved å se på resten av konteksten i kollonen for den enkelte person, men som oftest lot ikke det seg gjøre. Det er også ofte at innholdet i en celle er uklart, da har jeg også sett på resten av kollonene for å avgjøre så godt som mulig. Så når jeg har kodet disse feltene så har mange av de havnet i diversekategorien. Dette behøver ikke å være et stort problem etter som jeg er opptatt av "de store tallene". De gangene det kan ha noen innvirkning er i årene 1917-1919, for da er antallet reisende meget lav, og antallet utvandrere enda lavere. Lave emigranttall i disse årene er et annet problem. Når antallet er så lavt kan tilfeldigheter spille inn på resultatene.
Jeg har brukt Bergens Tidende for å undersøke hva som sto i avisene om utvandring til Amerika. Jeg har konsentrert meg om å se på aviser fra våren 1917 etter at tyskerne igjen satte igang med sin ubegrensete ubåtkrig, og USA ble med i krigen. Aviser fra januar og februar 1918 er også blitt undersøkt. Jeg har sett i avisene om jeg kunne finne ut hva det var skrevet om verdenskrigen som kunne ha betydning for nedgangen i utvandringen til Amerika. Hva har folk lest i avisene om hvordan det var å emigrere under første verdenskrig. Avisene var på den tiden vel den viktigste informasjonskilde for folk flest, og hva som var skrevet der kan ha hatt betydning for om de ville reise eller ikke. Aviser kan være en litt vanskelig kilde å bruke etter som hva som er skrevet vil være nokså subjektivt. Men siden jeg bare er ute etter hva folk leste, og ikke om dette var sannhten, så behøver ikke det ha noe å si. Jeg kan ikke komme på hva Bergens Tidende kunne tjene på å skrive som var feil, og påvirke utvandrinsstrømmen. Et annet problem er at man ikke vet om lesergruppen var potensielle utvandrere og folk som vandret ut. Men ved å velge Bergens Tidende så regner jeg med at en stor del av folk som ville ha emigrert over Bergen ville ha lest den.
Norsk Offentlig Statistikk har jeg brukt for å kunne sammenligne tall fra Emigrantprotokollene, som gjelder for emigrasjon over Bergen havn, med tall fra hele landet. Når jeg selv har laget statistikk som jeg har villet sammenligne med NOS, har jeg gjort dem så lik som mulig. Dette har påvirket blant annet kodingen av emigrantprotokollene. Et problem som er oppstått er at jeg ikke vet om NOS opererer med ,som i Emigrantprotokollene, alle reisende fra Norge, eller bare virkelige emigranter. En fordel med NOS er at tallmaterialet er større der enn i Emigrantprotokollene, så de er mindre påvirkelig for tilfeldigheter.
Jeg har hatt behov for å kode de fleste av de feltene jeg har undersøkt. Ved å kode så tilpasser man materialet til det man er interessert i å undersøke. Man lager nye kategorier som samler andre kategorier. Dette kan føre til at man mister verdifull informasjon. En del detaljer vil forsvinne idet kodete materiellet som fantes i den orginale kilden. Men det er ikke alltid at dette har noen praktisk betydning. I min kilde er det for eksempel oppført under feltet mål 15 skrivemåter for byen New York. Når jeg er interessert i å vite hvor de ulike reiste for å kunne se hvilke konsekvenser krigen hadde for nedgang i utvandrertallet, så har det liten eller ingen betydning hvordan New York blir skrevet. Ved kodingen lager man nye kategorier på de reisende. Istedet for å lage en tabell der man opererer med 2000 ulike reisemål, så kan man samle alle som skulle til USA i en gruppe, og alle som skulle til Canada i en annen gruppe. Da kan man kanskje finne ut om reisemålet til emigrantene forandret seg under krigen. Når jeg har kodet kildene har jeg prøvd å kode dem slik at jeg vil få svar på det jeg spør om. Et eksempel er når jeg har delt de reisende inn i alder og kjønn. For å finne ut om unge menn er skremt for å reise fordi de tror de kan bli vervet til verneplikt i USA, så har jeg delt dem inn etter aldersbolker på fem år fra 15 til 44 år, og resten av de reisende i en samlegruppe.
Kombinasjoner av ulike felter i tabeller kan si oss noe om den videre sammensetningen i en gruppe. Dette har vært spesielt viktig når jeg har prøvd å finne ut noe om de virkelig emigrantene. Da har jeg måttet splitte opp tabeller slik at jeg skiller emigrantene, slik jeg har definert dem, fra resten av de reisende. I CensSys er det lett å kombinere ulike felter ved å splitte opp ulike tabeller. Ved å for eksempel lage en tabell med alder og kjønn. Da ser man hvor mange av hvert kjønn i de ulike aldersgruppene som reiste over Bergen havn Om man da videre deler dem inn etter av hvilken årsak de reiste får man isolert de som ikke var emigranter fra dem som var emigranter. Jeg har så addert sammen de gruppene jeg regner som utvandrere, og laget tabeller. Det har vært meget viktig i denne oppgaven etter som et betydelig antall i protokollene ikke var utvandrere.
Når jeg har laget diagrammer eller tabeller for å presenter tallmaterialet har jeg brukt Microsoft Word og Microsoft Excel. Da har tallmaterialt blitt skrevet over i de enkelte progammene, og behandlet videre der. For å gjøre det mer oversiktlig har jeg bare satt inn det som har vært relevant for hva jeg har vært interessert i. Som når jeg har laget et diagram der jeg viser hvilke mål de ulike reisende har hatt. Da har jeg bare tatt med de som skulle enten til USA eller Canada. Når jeg har undersøkt Emigrantprotokollene fra Bergen i årene 1911-1924, så har jeg brukt database styringssystemet CensSys. CensSys er av en hierarkisk struktur og deler Emigrantprotokollene inn etter årstall i øverste nivå, og 21 ulike felter for hver person under årstallet. Kilden er blitt brukt til å prøve å påvise forandringer i emigrantsammensetningen over tid. Så for å kunne få et overblikk over kilden har det vært viktig å kunne kode kilden på en enkel og god måte. Kodingen fungere veldig lett i CensSys, så programmet har fungert bra for meg.