Dataflyt

Fra nhm/skf/best-practices
Revisjon per 14. sep. 2017 kl. 07:43 av Gunnhilm@uio.no (diskusjon | bidrag) (Bakgrunn)

(diff) ← Eldre revisjon | Nåværende revisjon (diff) | Nyere revisjon → (diff)
Hopp til: navigasjon, søk

Link: Best-practice manual for geolocation at NHM

Denne wikien er under oppbygging - legg gjerne inn informasjon!

Best-practice manual for dataflyt ved NHM

Sist endret 22.8.2017

Omhandler dataflyt fra felt til database.

Mål for rutinene våre:

  • Skrive minst mulig for hånd, mest mulig automatisk

Bakgrunn

Data for de ulike samlingene finnes i ulike databaser:

Gruppe Organismegruppe Database Kontaktperson
Geologi Mineraler
Paleontologi
Botanikk Levende planter Iris
Moser
Alger
Karplanter Musit
Diatomer
Geologi Mineraler
Mykologi Lav Musit Einar Timdal
Sopp Musit Karl-Henrik Larsson

Katriina Bendiksen

Zoologi Pattedyr Specify Øystein Wiig
Fugl Corema Jan T. Lifjeld

Lars Erik Johannessen

Fisk og herptiler Access Åge Brabrand

Ann-Helen Rønning

Insekter Musit Geir Søli

Dawn Williams

Krepsdyr mm Åse Wilhelmsen
Bløtdyr mm På vei inn i Musit Torsten Struck

Ann-Helen Rønning

Helminter mm På vei inn i Musit Torsten Struck

Ann-Helen Rønning

DNA og vevsprøver Corema Arild Johnsen

Lars Erik Johannessen

Innsamling

Innsamlingsnummere/Collection-number

Skal være unike.

Eksempler:

  • Initialer og årstall og løpenummer per år: ON16-001 for Ola Nordmanns første prøve fra 2016
  • Musit reg.nummer:
    • reserver en serie på forhånd
    • skriv ut lapper med 1D strekkoder og musitnummere
    • før inn musitnumrene i excel med stjerne foran og bak (f.eks. *260501*) og velg font Free 3 of 9
  • Waypunkt fra GPS (ikke nødvendigvis unikt)
  • bildenavn
  • UUID
    • Insekter: kan gis i felt: legg insektet i rør med sprit, legg spritrøret i større rør med UUID-lapp (relevant ved subsampling til DNA analyser i felt) (UUID-lappen tåler ikke sprit). Ta med 2D strekkodeleser og pc i felt

Innsamlingsdata

Se egen wiki for koordinater

Data til Musit

Dataverktøy for bruk i felt

Digiart

Digiart er Vidar Bakkens software for registreringer i artsobs. Programmet er laget for felt-pc’er med touch-screen og innebygget gps, men fungerer også på vanlig pc. Det er lagt til funksjoner for å merke av at belegg samles inn, og for eksport av data til MUSIT import-ark.

Einar Timdals Excel-system

Utviklet for prøvetaking til DNA analyser i felt. Man fyller ut en strekkode-sampling-fil, med minst mulig info (brønn-nr, ev. innsamlingsno, bildenavn, ev gps-punkt). Etter feltarbeidet fyller man ut en innsamlingsfil, som blir utgangspunkt for MUSIT-import. Her føres alle data om tid, sted og personer. Dataene fra dette excel-arket formatteres for MUSIT import-ark ved hjelp av Visual Basic-scripts implementert i en webside.

MUSIT Excel import-ark

I MUSIT-import-arket legger man inn data i et spesifikt format med hjelp av makroer. Deretter kan man foreta validering av dataene, og eksport til Darwin-core-format, som så kan importeres til MUSIT.

Felt-pad - hardware

GeCo har flere felt-PAD’er som kan lånes: GETAC-F110.  De har Windows 10, Intel Core i7vPrD, 11.6’’ TFT LCD HD, batteri med opptil 12 timers levetid, innebygget GPS og SIM med mobilnett. De er vanntette, man kan bytte batteri mens man jobber og de har bæresele. GeCo har flere batterier for hver pad.

Kalenderen for booking av FELTPAD er på nett; https://docs.google.com/spreadsheets/d/1aTUeTcajG0C5yXCxXph_JqL0Ht0S3s5mJPFm-VqIJPs/edit?pref=2&pli=1#gid=997111749. Bruk den fornuftig, og kun studenter/ansatte ved NHM kan stå som lånetaker.

Figur: Dataflyt ved NHM for organsimer som er i MUSIT

Data til Corema

Se DNA bankens egen side på wiki’en, og Best practice for strekkoding

DNA strekkode data til BOLD

Data går først til Musit, derfra til Corema, og derfra til BOLD, vha eksportfunksjoner.

Se egen best practice .

Data til GBIF

Går automatisk

Data til Artskart

Artskart mottar data fra blant annet GBIF og Artsobservasjoner. Noen ganger er det samme data. En måte å unngå dobbeltrapportering i Artskart er å ta med Artsobservasjons-nummeret i musit/GBIF. Da blir Artsobservasjon-datapunktet gjemt, og bare GBIF-punktet blir liggende.