Ohje:Oikoluku Proofread Page -laajennuksen avulla

Wikiaineistosta

Tässä ohjeessa käsitellään dokumenttien oikolukua Proofread Page -laajennuksen avulla. Laajennus helpottaa skannattujen dokumenttien lisäämistä Wikiaineistoon. Samalla sivun artikkelin luotettavuus paranee, koska alkuperäinen dokumentti on nähtävissä. Laajennusta käyttävien artikkelien yläosan välilehdillä on Lähde-välilehti, josta pääsee skannatun dokumentin hakemistosivulle. Tarkistettavuuden helpottamiseksi voi tekstin sekaan lisätä linkkejä dokumentin sivuille.

Tallennus[muokkaa]

  • Tallenna skannattu dokumentti Wikimedia Commonsiin tai Wikiaineistoon. Dokumentti voi olla PDF-, DJVU- tai kuvatiedosto. Jos dokumenttiin on lisätty automaattisella tekstin tunnistuksella (OCR) luettu teksti, lisätään se generoitujen sivujen pohjatekstiksi. Tällöin oikolukijan tarvitsee vain tarkistaa ja korjata OCR-tekstiä.

Hakemistosivu[muokkaa]

  • Luo samanniminen sivu Hakemisto-nimiavaruuteen.
    • Esim. jos ladatun tiedoston nimeksi tuli Tiedosto:Kyläkirjaston Kuvalehti 11 15 11 1888.pdf, hakemistosivun nimeksi tulee Hakemisto:Kyläkirjaston Kuvalehti 11 15 11 1888.pdf
  • Lisää sivut kenttään <pagelist />, joka luo linkit ladatun tiedoston yksittäisiin sivuihin

pagelist-tagi[muokkaa]

Hakemistosivun Sivut-kentään voi lisätä linkit dokumentin sivuihin joko käsin tai automaattisesti pagelist-tagin avulla. Yksinkertaisessa muodossa tagi numeroi kaikki dokumentin sivut:

<pagelist />

Usein dokumentin sivunumerot eivät kuitenkaan vastaa skannatun dokumentin sivuja. Näissä tapauksissa pagelist-tagin sisään voi lisätä sivujen uudelleen numeroinnin:

<pagelist 
  1=kansi
  2=nimiö
  3=1
/>

Edellisessä esimerkissä kolmossivu merkitään ensimmäiseksi ja neljäs toiseksi jne.

Oikoluku[muokkaa]

  • Kun Sivu-nimiavaruuden sivu avataan muokattavaksi. Pitäisi vasemmalla puolella olla tekstilaatikon ja oikealla näkyä skannatun dokumentin sivu. Jos dokumenttiin on sisällytetty OCR-teksti, on se kopioitu tekstilaatikoon.
  • Tekstistä voi erotella osioita <section>-tageilla tai lyhyemmin ##-merkkauksella, jolloin merkitään vain osion alku, jolloin osio päättyy seuraavaan vastaavasti merkittyyn kohtaan tai sivun loppuun. Esimerkki:
<section begin="Yleinen kuulutus" />
...
<section end="Yleinen kuulutus" />
tai
## "Yleinen kuulutus" ##
...

Section-tageilla merkittyjä osia voi olla useita sisäkkäin ja jopa lomittain.

  • Valitse ennen tallentamista yhteenvetokentän alapuolisista napeista oikoluvun valmiusaste ("Sivun tila"):
    • Ilman tekstiä Sivu on tyhjä tai siinä ei ole mitään dokumentin kannalta oleellista tekstiä.
    • Oikolukematta Sivua ei ole kertaakaan oikoluettu. Oletus uusilla sivulla.
    • Ongelmallinen Sivulla on jokin ongelma joka kaipaa huomiota. Ongelmalliseksi merkityt sivut lisätään Ongelmallinen-luokkaan.
    • Oikoluettu Sivu on oikoluettu ainakin kerran.
    • Tarkistettu Sivu vastaa täysin alkuperäisen dokumentin sivua ja vähintään kaksi käyttäjää on todennut tämän. Tämän vaihtoehdon voi valita vain eri käyttäjä kuin sivun oikoluetuksi merkinnyt käyttäjä eikä valintaa ole aina näkyvissä.

Sisällytys[muokkaa]

  • Sisällytä oikoluettu teksti sivulle, jolle haluat tekstin. Tekstin voi sisällyttää usealla eri tavalla. Kätevimmin se käy <pages />-tagilla. Esim.
    • Esim. <pages index="Sanomia_Turusta_6_10_02_1871.pdf" from=2 fromsection="Yön kertomus" to=2 tosection="Yön kertomus" />

pages-tagi[muokkaa]

  • Kaikki sivut (kokonaan) esim. väliltä 2–5 voi sisällyttää seuraavasti
  • Parametrit:
    index hakemistoivun nimi ilman nimiavaruutta eli Hakemisto-osaa
    from sivu, josta lähtien teksti sisällytetään
    to sivu, johon asti teksti sisällytetään
    fromsection osio ensimmäisellä sivulla, josta lähtien teksti sisällytetään
    tosection viimeinen osio viimeisellä sivulla, joka vielä sisällytetään
    onlysection sisällytettävä osio, jos sivulla on useita osioita

Esimerkit[muokkaa]

  • Teksti, joka täyttää muutaman sivun kokonaan:
    <pages index="tiedosto" from=2 fromsection="osio" to=5 />
  • Yksittäinen lehtiartikkeli lehden yhdellä sivulla, jolla on muitakin artikkeleita:
    <pages index="Sanomia_Turusta_6_10_02_1871.pdf" from=2 to=2 onlysection="Yön kertomus" />
  • Usealle sivulle ulottuva artikkeli, jossa ensimmäisellä ja viimeisellä sivulla on muita artikkeleita:
    <pages index="Kyläkirjaston_Kuvalehti_11_15_11_1888.pdf" from=3 fromsection="Suomussalmelaisen käynti Ateneumissa" to=5 tosection="Suomussalmelaisen käynti Ateneumissa" />