Forskjell mellom versjoner av «Kategori:Polyglotta:ToDo»

Fra hf/dmlf
Hopp til: navigasjon, søk
 
(29 mellomliggende revisjoner av samme bruker vises ikke)
Linje 1: Linje 1:
=== Rutine for å bygge ord for ord-leksika for BP. ===
+
=== Senere faser ===
  
1. Finn det utalget av tekster i eksportformat som skal være grunnlaget for leksikonet, L.<br>2. Rens teksten for alt annet en ordene.<br>3. Alfabetiser Sanskrit (=Originalspråk=O) etter sanskrit rekkefølge<br>4. Grupper alle ordene under røtter (=rot-gruppe, RG). (Ord er alle enheter som er bøyd med endelse, på sanskrit skilt ved blank eller skilletegn.)<br>5. Bygg multipler (MT) av de eksporterte materialet (det man skal lage L av, e.g. alle tekstene i TLB, san,tib,chi,eng= Tr1,Tr2,Tr3,Tr4).<br>6. Velg en RG av gangen og søk alle ordene i den i det samlede valgte multippelmaterialet , saml så opp alle de multiplene der disse ordene finnes.<br>7. Finn så de Tr-ordene som forekommer flest, nest flest, tredje, fjerde og femte etc. flest ganger hver for seg av tib, chi eng, i de relevante MT, og sett dem opp alfabetisk (etter den orden språket alfabetiseres etter) og etter frekvens. Husk at tib og kin, selv engels og andre språk, har vanligvis flere stavelser, selv ord, med mellomrom (ikke kin) for et ord. Her må det settes en grense, f. eks ti eller tyve stavelser. Disse tib,chi,eng-ordene vil med høy grad av sannsynlighet tilsvare san-ordene i den aktuelle RG.<br>8. Velg manuelt hver for seg de Tr som henhører til en RG.<br>9. Finn alle MT der det finnes et av O ord i RG, men i Tr ingen av de ordene som så langt er registrert, og få på denne måten tak på alle de ennå ikke registrerte ekvivalenter.<br>10. Kjør alle enkeltordene i den valgte RG, med de etablerte Tr for hele en RG, mot hele dette utvalgte MT-materialet, slik at hvert enkelt ord i en RG ekvivaleres med akkurat de Tr som tilsvarere akkurat dette bøyde O-ordet.<br>11. Bygg det hele inn i L etter et alfabetisk og grammatisk analytisk format, RG for RG.<br>Dette er begynnelsen på å etablere et L, men når det lastes inn flere tekster og mer ordmateriale, må dette kumulativt integereres i L.<br>12. Lag en ordnet liste over alle O-ordene i den nye teksten.<br>13. Finn alle O-ord fra den nye teksten i det bestående L.<br>14. Undersøk om ekvivalentene til disse ordene i den nye tekstens MT finnes allerede i L, og om dette ikke er tilfelle, skriv ut alle de hertil tilhørende MT i nye tekstens, slik at de nye ekvivalentene i disse kan integeres i L.<br>15. Finnn alle O-ordene (resten!) i den nye teksten som ikke finnes i det gamle L.<br>16. Relater dem til de relevante MT og finn deres Tr-ekvivalenter etter samme metode som ovenfor med det nye MT som materiale.<br>17. Integrer resultatet i L, enten som nye RG eller i allerede eksisterende RG.
+
{| border="1" cellspacing="1" cellpadding="1" width="600"
 
 
<br>
 
 
 
=== Opprydning etter fase 2  ===
 
 
 
{| width="600" border="1" cellpadding="1" cellspacing="1"
 
|-
 
| <strike>Lenke i admin-signaturen til dokumentasjonen på wiki. F.eks. med navn Polyglotta-wiki.</strike>&nbsp;
 
| Heidi
 
|-
 
| <strike>Lenke i generell visning til dokumentasjonsside om søk i wiki. General search-help</strike>.
 
| Heidi
 
|-
 
| <strike>Endre help for diacritica til diacritika-documentation.</strike>
 
| Heidi
 
|-
 
| <strike>Skrive side, har opprettet en som heter:&nbsp;https://wiki.uio.no/hf/dmlf/index.php/Kategori:Polyglotta:Documentation:SearchHelp</strike>
 
| Fredrik, Jens
 
|-
 
| Ny søkemodus. Exact phrase-søk uten regex.&nbsp;
 
| Asgeir
 
|-
 
| Ny søkemodus. Exact phrase-søk uten regex. Visning i grensesnittet. Default-valg.
 
| Heidi
 
|-
 
| <strike>Mulighet for å legge inn lister med funksjon i ckeditor for meta.</strike>
 
| Heidi
 
|-
 
| <strike>Se nærmere på css'en for choose texts der denne får en ekstra s under.&nbsp;</strike>
 
| Heidi
 
|-
 
| <strike>Popup menyer bør forsvinne ved klikk utenfor vindu.</strike>
 
| Heidi
 
|-
 
| <strike>Gå over til å sortere metaposter på sorteringsfeltet i steden for link form-feltet når denne informasjonen er fyllt ut og på plass. Det vi nok da gjelde for sortering i abbreviations, forkortelser og verkside. Er naturligvis også mulig å bare beholde link form, men det kan nok være tilfeller hvor det er praktisk å benytte feltene til forskjellige formål.</strike>
 
| Heidi
 
|-
 
| <strike>Sidehenvisning i fulltekst. Bindestrek skal kun benyttes til å skille mellom start og slutt for en linje. Bruker regex for å brekke opp referansen hvis det er bindestrek i dem. Doble kildenavn skal også fjernes. Hvis det er komma i kilderef og tallet foran komma er likt som kilderef for starten på containeren, så fjernes tallet i siste referanse.</strike>
 
| Heidi
 
 
|-
 
|-
| <strike>Kortere levetid på cookies. En uke.</strike>
 
| Heidi
 
|-
 
| <strike>Bokser for seriestrykning i image admin.</strike>
 
| Heidi
 
|-
 
| <strike>Admin forkortelses-liste på en linje ikke to.</strike>
 
| Heidi
 
|-
 
| <strike>Main-meta tar ikke med verdien for sortering i sorteringsfeltet.</strike> <strike>Sjekk også de andre.</strike>
 
| Heidi
 
|-
 
| <strike>Knapp/funksjon for new record i sentence by sentence for admin.</strike>
 
| Heidi
 
|-
 
| <strike>Knapp/funsjon for ny container med record i, i sentence by sentence.</strike>
 
| Heidi
 
|-
 
| <strike>Knapp/funksjon for å slette record</strike>
 
| Heidi
 
|-
 
| <strike>Knapp/funksjon for å slette container.</strike>
 
 
|  
 
|  
 
|-
 
|-
| <strike>Se på bla-funksjon med flere multipler enn en, enkelt å fikse?</strike>
 
| Heidi
 
|-
 
| Se over hastighet i forhold til sql.&nbsp;
 
| Heidi
 
|-
 
| Se på css i forhold til javascript-vinduer og lav oppløsning. <strike>Klikke hvor som helst for å fjerne bokser. Endre pictures til images i display pictures and footnotes. Enter number of multiples skal være svart.</strike>
 
| Heidi
 
|-
 
| <strike>Tekst for knappen display images and footnotes. Hva skal det stå der</strike>?
 
| Jens, Fredrik
 
|-
 
| <strike>17 teser fra Jens. Skal inn i wikien under dokumentasjon.&nbsp;</strike>
 
| Jens
 
|-
 
| Gå igjennom og sjekke den nye css/html'en ved lavere resolusjon. Spesielt fokus på boksene.
 
| Heidi
 
|-
 
| En enkel liste over søkeord som bør med i meta-taggingen av hovedsiden.
 
| Jens, Fredrik
 
|-
 
| <strike>Større padding i venstremeny. Eks. uoversiktlig for ibsen</strike>
 
|
 
|-
 
| <strike>Listestil, eks skal ha tall, varna havaran ..et ellet annet</strike>
 
 
|  
 
|  
 +
settingss-side for fulltekst(hver tekst eller bibliotek i admin) hvor man kan definere om det er mer tekst enn 'no english som burde fjernes fra visning'. Noe kan passse i records-men ikke i fulltekst.
 +
 +
Midlertidig løsning kan være legge til 'see next record' og 'see previous record' som en nestet replace i sql'en der vi allerede har en replace av ex. 'no english'. Ser imidlertid ut til å være for mange varianter av setninger med record i. Kan fjerne alle setninger med ordet record i, men tror det fort kan få uante konsekvenser &nbsp;+ at det er litt dumt å legge inn så lokale fix'er.
 +
 
|-
 
|-
| Images doesn't show as default when cookies is removed.  
+
| En enkel liste over søkeord som bør med i meta-taggingen av hovedsiden.
|
 
 
|-
 
|-
| bibliography dukker ikke opp i contents før abb eller noe legges inn under + store mellomrom mellom items'ene før det legges til noen av assosiasjonen under.
+
| i edit for sentence by sentence, funker return forskjellig avhengig av om den brukes i tekstfelt, tekstarea eller til å navigere til neste side. Kan det endres til at den funker som 'lagre' for tekstarea også?
|
 
 
|-
 
|-
| <strike>Hvis to kilder, få med begge i kilderef for fulltekst.</strike>
 
 
|  
 
|  
|-
+
Hvis kildeskifte imellom bokmerker, skriv ut start og sluttref for hver kilde. (kilderef i fulltekst)<br>Henvisninger må finne høyeste og laveste henvisning for å skrive ut korrekt.  
| Infoforside-boks bør matche lengden på bibliotek-boksene. (Når tid)  
 
| Heidi
 
|-
 
| <strike>Legge på at klikk på hele bibliotekboksen førere videre til biblioteket.</strike>
 
| Heidi
 
|-
 
| <strike>Sjekk overskrifter i vis_meta for &lt;/br&gt; slik at det blir lik avstand etter og før. Ønsker ca 2 linjer avstand før og en etter.</strike>
 
| Heidi
 
|}
 
 
 
<br>
 
 
 
=== Senere faser  ===
 
  
{| border="1" cellspacing="1" cellpadding="1" width="600"
 
 
|-
 
|-
 
|  
 
|  
Hvis kildeskifte imellom bokmerker, skriv ut start og sluttref for hver kilde. (kilderef i fulltekst)<br>Henvisninger må finne høyeste og laveste henvisning for å skrive ut korrekt.
+
Legge på UiO-profilen<span class="Apple-tab-span" style="white-space:pre"> </span>&lt;span class="Apple-tab-span" style="white-space:pre" /&gt;
  
 
|-
 
|-
| Gå igjennom rettighetsoppsett og sikkerhet.
+
| markering i meny på fulltekst, bør ikke farge undermeny før denne er eksplisitt trykket på..
 
|-
 
|-
| Gå over til zend - struktur.
+
|  
 
|-
 
|-
| Rydde vekk gammel kode. (Lage array med oversikt over forkortelser for func og new_record_knapp + navn knappene)
+
| Mulighet til å legge inn meta for kilde og visning av denne metaen kildesiden.
 
|-
 
|-
| Plugins for referanseapparatet i ckeditor.
+
| Lage et grensesnitt for å velge oppsett på verk-sider o.l
 
|-
 
|-
| Meta introduksjoner på forskjellige språk. Med i innholdsfortegnelsen-&gt;underkategorier i basen? Egne forsider for hver oversettelse?
+
|  
 
|-
 
|-
| Endring av utseende i sentence by sentence: Bokser rundt hvert språk, kilde til venstre, sidehenvisning til høyre, fjerne forkortelser for verk og ha f.eks oppe i hjørnet. Muligens kunne velge mellom stil som er nå og stil som kommer.
+
| Meta introduksjoner på forskjellige språk. Med i innholdsfortegnelsen-&gt;underkategorier i basen? Egne forsider for hver oversettelse? trengs det?
 
|-
 
|-
| Skrive om fulltext-kode på samme måte som image-admin for å øke hastigheten
+
| Gå igjennom og se på betraktninger sendt av Amund, Fredrik og Jens om utseende og visning av metadata o.l.
 
|-
 
|-
| Mulighet til å legge inn meta for kilde og visning av denne metaen på kildesiden.
+
| Endring av utseende i sentence by sentence: Bokser rundt hvert språk, kilde til venstre, sidehenvisning til høyre, fjerne forkortelser for verk og ha f.eks oppe i hjørnet. Muligens kunne velge mellom stil som er nå og stil som kommer. navn funskjon: edit record view.
|-
 
| Lage et grensesnitt for å velge oppsett på verk-sider o.l
 
|-
 
| Gå igjennom og se betraktninger sendt av Amund, Fredrik og Jens om utseende og visning av metadata o.l.
 
 
|-
 
|-
 
| Ipad-css-versjon?
 
| Ipad-css-versjon?
Linje 151: Linje 48:
 
|-
 
|-
 
| Få lagt til kun sidenummerering som en mulighet i import-maskinen. Henvisninger kan være bare sidetall (uten side og linje). Dette må kunne genereres med refengine ved import.<br>
 
| Få lagt til kun sidenummerering som en mulighet i import-maskinen. Henvisninger kan være bare sidetall (uten side og linje). Dette må kunne genereres med refengine ved import.<br>
 +
|-
 +
| kategorisering/kategorier av tekster innenfor biblioteker. Hva trengs menymessig? ellers?&nbsp;
 +
|-
 +
| Mulighet for egen stylesheet for hvert bibliotek. Bade i fulltekst og i sentence by sentence. Legg til stylesheet-navn-felt i basen og hent riktig stylesheet i head-fila. Legg uansett til default og så spesifikt. Da bør den spesifikke overstyre den før.
 +
|-
 +
| Gå igjennom rettighetsoppsett og sikkerhet.
 +
|-
 +
| Gå over til zend - struktur.
 +
|-
 +
| Legge til mulighet i admin til å endre rekkefølge på tekstvariantene.
 
|}
 
|}
 +
 +
<br>
 +
 +
=== Rutine for å bygge ord for ord-leksika for BP.  ===
 +
 +
1. Finn det utalget av tekster i eksportformat som skal være grunnlaget for leksikonet, L.<br>2. Rens teksten for alt annet en ordene.<br>3. Alfabetiser Sanskrit (=Originalspråk=O) etter sanskrit rekkefølge<br>4. Grupper alle ordene under røtter (=rot-gruppe, RG). (Ord er alle enheter som er bøyd med endelse, på sanskrit skilt ved blank eller skilletegn.)<br>5. Bygg multipler (MT) av de eksporterte materialet (det man skal lage L av, e.g. alle tekstene i TLB, san,tib,chi,eng= Tr1,Tr2,Tr3,Tr4).<br>6. Velg en RG av gangen og søk alle ordene i den i det samlede valgte multippelmaterialet , saml så opp alle de multiplene der disse ordene finnes.<br>7. Finn så de Tr-ordene som forekommer flest, nest flest, tredje, fjerde og femte etc. flest ganger hver for seg av tib, chi eng, i de relevante MT, og sett dem opp alfabetisk (etter den orden språket alfabetiseres etter) og etter frekvens. Husk at tib og kin, selv engels og andre språk, har vanligvis flere stavelser, selv ord, med mellomrom (ikke kin) for et ord. Her må det settes en grense, f. eks ti eller tyve stavelser. Disse tib,chi,eng-ordene vil med høy grad av sannsynlighet tilsvare san-ordene i den aktuelle RG.<br>8. Velg manuelt hver for seg de Tr som henhører til en RG.<br>9. Finn alle MT der det finnes et av O ord i RG, men i Tr ingen av de ordene som så langt er registrert, og få på denne måten tak på alle de ennå ikke registrerte ekvivalenter.<br>10. Kjør alle enkeltordene i den valgte RG, med de etablerte Tr for hele en RG, mot hele dette utvalgte MT-materialet, slik at hvert enkelt ord i en RG ekvivaleres med akkurat de Tr som tilsvarere akkurat dette bøyde O-ordet.<br>11. Bygg det hele inn i L etter et alfabetisk og grammatisk analytisk format, RG for RG.<br>Dette er begynnelsen på å etablere et L, men når det lastes inn flere tekster og mer ordmateriale, må dette kumulativt integereres i L.<br>12. Lag en ordnet liste over alle O-ordene i den nye teksten.<br>13. Finn alle O-ord fra den nye teksten i det bestående L.<br>14. Undersøk om ekvivalentene til disse ordene i den nye tekstens MT finnes allerede i L, og om dette ikke er tilfelle, skriv ut alle de hertil tilhørende MT i nye tekstens, slik at de nye ekvivalentene i disse kan integeres i L.<br>15. Finnn alle O-ordene (resten!) i den nye teksten som ikke finnes i det gamle L.<br>16. Relater dem til de relevante MT og finn deres Tr-ekvivalenter etter samme metode som ovenfor med det nye MT som materiale.<br>17. Integrer resultatet i L, enten som nye RG eller i allerede eksisterende RG.
  
 
<br>  
 
<br>  
  
 
[[Category:Polyglotta|ToDo]]
 
[[Category:Polyglotta|ToDo]]

Nåværende revisjon fra 17. aug. 2012 kl. 14:01

Senere faser

settingss-side for fulltekst(hver tekst eller bibliotek i admin) hvor man kan definere om det er mer tekst enn 'no english som burde fjernes fra visning'. Noe kan passse i records-men ikke i fulltekst.

Midlertidig løsning kan være legge til 'see next record' og 'see previous record' som en nestet replace i sql'en der vi allerede har en replace av ex. 'no english'. Ser imidlertid ut til å være for mange varianter av setninger med record i. Kan fjerne alle setninger med ordet record i, men tror det fort kan få uante konsekvenser  + at det er litt dumt å legge inn så lokale fix'er.

En enkel liste over søkeord som bør med i meta-taggingen av hovedsiden.
i edit for sentence by sentence, funker return forskjellig avhengig av om den brukes i tekstfelt, tekstarea eller til å navigere til neste side. Kan det endres til at den funker som 'lagre' for tekstarea også?

Hvis kildeskifte imellom bokmerker, skriv ut start og sluttref for hver kilde. (kilderef i fulltekst)
Henvisninger må finne høyeste og laveste henvisning for å skrive ut korrekt.

Legge på UiO-profilen <span class="Apple-tab-span" style="white-space:pre" />

markering i meny på fulltekst, bør ikke farge undermeny før denne er eksplisitt trykket på..
Mulighet til å legge inn meta for kilde og visning av denne metaen på kildesiden.
Lage et grensesnitt for å velge oppsett på verk-sider o.l
Meta introduksjoner på forskjellige språk. Med i innholdsfortegnelsen->underkategorier i basen? Egne forsider for hver oversettelse? trengs det?
Gå igjennom og se på betraktninger sendt av Amund, Fredrik og Jens om utseende og visning av metadata o.l.
Endring av utseende i sentence by sentence: Bokser rundt hvert språk, kilde til venstre, sidehenvisning til høyre, fjerne forkortelser for verk og ha f.eks oppe i hjørnet. Muligens kunne velge mellom stil som er nå og stil som kommer. navn på funskjon: edit record view.
Ipad-css-versjon?
Søk på nettet med gitt ord skal gjøre oppslag i BP, når ordliste på plass.
Ordliste
Sentence by sentence med javascript/ajax
Få lagt til kun sidenummerering som en mulighet i import-maskinen. Henvisninger kan være bare sidetall (uten side og linje). Dette må kunne genereres med refengine ved import.
kategorisering/kategorier av tekster innenfor biblioteker. Hva trengs menymessig? ellers? 
Mulighet for egen stylesheet for hvert bibliotek. Bade i fulltekst og i sentence by sentence. Legg til stylesheet-navn-felt i basen og hent riktig stylesheet i head-fila. Legg uansett til default og så spesifikt. Da bør den spesifikke overstyre den før.
Gå igjennom rettighetsoppsett og sikkerhet.
Gå over til zend - struktur.
Legge til mulighet i admin til å endre rekkefølge på tekstvariantene.


Rutine for å bygge ord for ord-leksika for BP.

1. Finn det utalget av tekster i eksportformat som skal være grunnlaget for leksikonet, L.
2. Rens teksten for alt annet en ordene.
3. Alfabetiser Sanskrit (=Originalspråk=O) etter sanskrit rekkefølge
4. Grupper alle ordene under røtter (=rot-gruppe, RG). (Ord er alle enheter som er bøyd med endelse, på sanskrit skilt ved blank eller skilletegn.)
5. Bygg multipler (MT) av de eksporterte materialet (det man skal lage L av, e.g. alle tekstene i TLB, san,tib,chi,eng= Tr1,Tr2,Tr3,Tr4).
6. Velg en RG av gangen og søk alle ordene i den i det samlede valgte multippelmaterialet , saml så opp alle de multiplene der disse ordene finnes.
7. Finn så de Tr-ordene som forekommer flest, nest flest, tredje, fjerde og femte etc. flest ganger hver for seg av tib, chi eng, i de relevante MT, og sett dem opp alfabetisk (etter den orden språket alfabetiseres etter) og etter frekvens. Husk at tib og kin, selv engels og andre språk, har vanligvis flere stavelser, selv ord, med mellomrom (ikke kin) for et ord. Her må det settes en grense, f. eks ti eller tyve stavelser. Disse tib,chi,eng-ordene vil med høy grad av sannsynlighet tilsvare san-ordene i den aktuelle RG.
8. Velg manuelt hver for seg de Tr som henhører til en RG.
9. Finn alle MT der det finnes et av O ord i RG, men i Tr ingen av de ordene som så langt er registrert, og få på denne måten tak på alle de ennå ikke registrerte ekvivalenter.
10. Kjør alle enkeltordene i den valgte RG, med de etablerte Tr for hele en RG, mot hele dette utvalgte MT-materialet, slik at hvert enkelt ord i en RG ekvivaleres med akkurat de Tr som tilsvarere akkurat dette bøyde O-ordet.
11. Bygg det hele inn i L etter et alfabetisk og grammatisk analytisk format, RG for RG.
Dette er begynnelsen på å etablere et L, men når det lastes inn flere tekster og mer ordmateriale, må dette kumulativt integereres i L.
12. Lag en ordnet liste over alle O-ordene i den nye teksten.
13. Finn alle O-ord fra den nye teksten i det bestående L.
14. Undersøk om ekvivalentene til disse ordene i den nye tekstens MT finnes allerede i L, og om dette ikke er tilfelle, skriv ut alle de hertil tilhørende MT i nye tekstens, slik at de nye ekvivalentene i disse kan integeres i L.
15. Finnn alle O-ordene (resten!) i den nye teksten som ikke finnes i det gamle L.
16. Relater dem til de relevante MT og finn deres Tr-ekvivalenter etter samme metode som ovenfor med det nye MT som materiale.
17. Integrer resultatet i L, enten som nye RG eller i allerede eksisterende RG.


Denne kategorien inneholder for tiden ingen artikler eller filer.