Ajutor pentru corectură

De la wiki.civvic.ro
Sari la navigare Sari la căutare

Vă mulțumim pentru intenția de a ne ajuta! Civvic.ro este la început de drum și ajutorul dumneavoastră este valoros.

Introducere

Primul obiectiv al Civvic.ro este să creeze o arhivă digitală a tuturor monitoarelor oficiale începând cu 22 decembrie 1989. Avem această arhivă în format PDF, dar este necesară o operație de conversie a monitoarelor într-un format nou, mai ușor de căutat, de indexat și de procesat. Pentru o bună parte din documentele PDF este necesar și un efort de corectură, întrucât ele au fost scanate după Monitoarele Oficiale produse la tipografie. Am automatizat pe cât s-a putut această conversie, dar este necesar și un efort uman semnificativ. Aici avem nevoie de ajutorul dumneavoastră.

Dacă aveți nelămuriri

Civvic.ro este încă în fașă și procedura de digitizare nu este 100% definitivată. Chiar și acest ghid este în continuă schimbare. Dacă vă împotmoliți, nu orbecăiți de unul singur; timpul dumneavoastră este prețios. Căutați ajutor printr-una din următoarele metode:

  • Luați legătura cu un administrator Civvic.ro.
  • Învățarea prin exemple este adesea mai rapidă decât citirea unei documentații. Dacă nu știți cum să formatați un anumit pasaj, vizitați Arhiva Monitorului Oficial și căutați un monitor care face deja ceva similar. Apoi, dați click pe „modifică” (sau pe „vezi sursa”, dacă nu sunteți conectați) și vedeți care este sintaxa wiki de care aveți nevoie.
  • MediaWiki este un sistem wiki foarte popular folosit, printre altele, și de Wikipedia. Puteți căuta dacă comunitatea editorilor Wikipedia are o soluție pentru problema dumneavoastră.
  • Urmăriți această pagină! Pe măsură ce ne trec pe sub ochi mai multe monitoare, continuăm să îmbunătățim acest ghid. Alegeți opțiunea „Urmărește” (de la meniul cu săgeată de sus-dreapta) pentru a fi la curent cu modificările aduse acestei pagini.

Pași pregătitori

Activați-vă diacriticele

Este vital să vă configurați calculatorul astfel încât să puteți citi și tasta semnele diacritice românești (Ă, Â, Î, Ș, Ț). Altfel, dacă dumneavoastră doriți să ne ajutați, dar produceți documente fără diacritice, atunci altcineva va trebui să petreacă foarte mult timp adăugând diacritice în textul dumneavoastră, ceea ce este o operație extrem de costisitoare. Din motive istorice, pentru literele Ș și Ț există două variante: cele cu virgulă (Ș, Ț) și cele cu sedilă (Ş, Ţ). Noi le folosim pe cele corecte, cu virgulă dedesubt.

Instrucțiunile exacte pentru a vă configura calculatorul să permită scrierea cu diacritice depind de tastatura pe care o aveți și de sistemul de operare folosit. Wikipedia prezintă un ghid detaliat care acoperă majoritatea cazurilor. Dacă întâmpinați dificultăți, contactați un administrator Civvic.ro și vă vom ajuta cu instrucțiuni specifice pentru calculatorul dumneavoastră.

Creați-vă un OpenID

Conținutul Civvic.ro este public, dar pentru crearea sau modificarea paginilor este nevoie să vă autentificați. Civvic.ro nu are propriul său sistem de conturi, ci necesită autentificarea cu OpenID; acesta este un standard deschis și larg răspândit pentru autentificarea indirectă a utilizatorilor. Avantajele OpenID sunt:

  • Nu este nevoie să vă înregistrați și să completați o serie de informații pe Civvic.ro, ceea ce vă economisește timp.
  • Nu este nevoie să țineți minte o parolă în plus.
  • Un cont OpenID, odată creat, poate fi refolosit pe orice site care admite OpenID, iar numărul acestora este în creștere.
  • Sunt șanse mari să aveți deja un OpenID, deoarece o mulțime de site-uri populare servesc și ca furnizori de OpenID, inclusiv Google și Yahoo.

Familiarizați-vă cu MediaWiki

Civvic.ro este un sistem wiki (engleză), adică un site web care permite editarea colaborativă a paginilor. Fiecare monitor oficial este, după conversie, o pagină pe acest wiki, de exemplu Monitorul Oficial 14/1990. Există o multitudine de pachete software care implementează site-uri wiki; Civvic.ro folosește motorul MediaWiki, unul dintre cele mai populare, pe care îl folosește și Wikipedia.

La editarea unei pagini wiki, trebuie respectată sintaxa wiki, adică notațiile prin care specificați că doriți să obțineți text bold, italic, titluri și subtitluri pentru secțiuni, cuprinsuri, legături, tabele, imagini etc. Sintaxa MediaWiki este documentată în următoarele pagini: formatare, legături, tabele, imagini și formule.

Vă încurajăm să vizitați pagina Sandbox, care este un „teren de joacă” în care puteți opera orice modificări doriți pentru a vă exersa cunoștințele de wiki. Puteți folosi și sandbox-ul Wikipedia.

Asigurați-vă că aveți un corector ortografic

Nu este obligatoriu să folosiți interfața web pentru tehnoredactarea documentului. Puteți folosi orice editor de texte doriți, câtă vreme în final produceți un document care folosește sintaxa MediaWiki și pe care îl copiați în fereastra de editare de la Civvic.ro.

În orice situație, însă, vă recomandăm să instalați un corector ortografic pentru editorul folosit. Veți depista multe erori și veți economisi mult timp dacă editorul vă subliniază greșelile de tipar. Acest ajutor este cu atât mai important cu cât multe dintre erorile introduse de recunoașterea optică a caracterelor sunt greu de depistat la o survolare neatentă cu ochiul liber (de exemplu, chearnă în loc de cheamă).

De exemplu, Cătălin.Frâncu folosește browserul Chrome cu pachetul de limba română. La editarea unei pagini, Chrome subliniază cuvintele greșite, dar numai pe cele peste care treceți cu cursorul de tastatură. De aceea, Cătălin navighează prin întregul document cu Ctrl-săgeată dreapta și corectează erorile pe măsură ce sunt subliniate. Desigur, pentru fiecare persoană unele metode funcționează mai bine sau mai rău.

Procedura de corectare a unui document PDF

Pe parcursul acestei secțiuni, vom presupune că încercați să digitizați monitorul oficial nr. 14 din anul 1990. Peste tot în această secțiune, înlocuiți 14 și 1990 cu numărul și anul monitorului oficial de care vă ocupați (desigur, Monitorul Oficial 14/1990 a fost deja digitizat). Precizăm că numărul monitorului nu este întotdeauna numeric. Vezi de exemplu Monitorul Oficial 132bis/1990. Anul este întotdeauna numeric, format din patru cifre.

Alegeți-vă un document

  • Vizitați admin.civvic.ro. Acesta este un site separat unde gestionăm lista de documente PDF și utilizatorii care se ocupă de ele, pentru a ne asigura că doi utilizatori nu lucrează la același document.
  • Conectați-vă cu OpenID-ul creat (vă recomandăm să folosiți același OpenID pe Civvic.ro și pe admin.civvic.ro).
  • Vizitați lista monitoarelor oficiale.
  • Alegeți un document care să nu fie deja repartizat cuiva. Pentru început, vă recomandăm unul cu cât mai puține pagini. Dați click pe document.
  • Revendicați documentul. Așa indicați că dumneavoastră vă ocupați de digitizarea acelui document, iar alți voluntari nu vor putea revendica același document. Stadiul documentului devine automat „în lucru”.
  • Descărcați documentul PDF original. Aveți nevoie de PDF pentru confruntarea textului extras cu originalul.
  • Copiați textul extras în clipboard (Ctrl-C). Puteți da click pe „vezi strict textul” pentru a vă fi mai ușor să selectați tot textul.

Creați pagina wiki

Pentru a începe digitizarea unui monitor oficial, vizitați pagina Monitorul Oficial 14/1990 și înlocuiți, în URL, 14 și 1990 cu numărul și anul dorit. Sistemul vă va semnala că nu există o pagină cu acest nume, ceea ce este normal. Dați click pe „creează această pagină”.

Decupați textul selectat la pasul anterior în fereastra de editare. De aici începe corectura propriu-zisă.

Antetul

Începutul oricărei pagini care conține un monitor oficial este

__FORCETOC__
[[Category:Monitorul Oficial|*1990 0014]]

= Monitorul Oficial al României =
Anul II, Nr. [[issue::14]] - Partea I - Marți, 23 ianuarie [[year::1990]]

  • Linia __FORCETOC__ cere ca cuprinsul paginii să fie tot timpul vizibil (altfel, MediaWiki ascunde cuprinsul paginii pentru pagini scurte).
  • Linia [[Category...]] include acest monitor oficial în Arhiva Monitorului Oficial. De asemenea, sunt indicate explicit anul și numărul monitorului. Subliniem că numărul monitorului trebuie indicat cu patru cifre (0014).
  • Ultimele două linii conțin titlul documentului, anul, numărul și data publicării, așa cum apar în documentul PDF.
  • Parantezele pătrate [[issue::14]] și [[year::1990]] definesc două proprietăți semantice pentru această pagină. Ele vor fi folosite în diverse interogări complexe asupra paginilor wiki. Nu trebuie să vă preocupați cu această sintaxă; urmați-o ca atare.

Cuprinsul

Cuprinsul paginilor wiki este generat automat pe baza ierarhiei de titluri și subtitluri. Cuprinsul monitorului oficial nu mai este necesar (și, de obicei, are și erori mari la scanare). Ștergeți-l.

Titluri și subtitluri

În Mediawiki, titlurile, subtitlurile, sub-subtitlurile etc. se obțin prin încadrarea textului între un număr corespunzător de semne „=”. Astfel, structura paginii pe care o creați va fi:

= Monitorul Oficial al României =
Anul II, Nr. 14 - Marți, 23 ianuarie 1990

== Decrete-lege ==

=== Decret-lege privind ... ===

... (cuprinsul decretului-lege) ...

=== Decret-lege privind ... ===

... (cuprinsul decretului-lege) ...

== Decrete ==

=== Decret privind ... ===

... (cuprinsul decretului) ...

=== Decret privind ... ===

... (cuprinsul decretului) ...

== Hotărâri ale Guvernului ==

=== Hotărâre privind ... ===

... (cuprinsul hotărârii) ...

=== Hotărâre privind ... ===

... (cuprinsul hotărârii) ...

Desigur, nu toate monitoarele oficiale conțin toate tipurile de acte. Dacă un monitor oficial nu conține hotărâri ale guvernului, secțiunea == Hotărâri ale Guvernului == va lipsi cu totul.

Anexe

Dacă un act are anexe, acestea vor fi indicate la nivelul 4 de subtitluri. Anexele pot avea număr de ordine sau nu și vor fi formatate astfel:

==== Anexă ====

'''Titlul anexei'''

... (conținutul anexei) ...
==== Anexa Nr. 3 ====

'''Titlul anexei'''

... (conținutul anexei) ...

Tabele

Din păcate, software-ul pe care îl folosim pentru digitizarea documentelor nu se descurcă mai deloc cu tabelele. Aproape întotdeauna apar erori atât de mari, încât este mai simplu să tastați manual tabelele care apar ocazional în anexele actelor. Puteți vizita manualul MediaWiki pentru informații despre sintaxa tabelelor și puteți consulta alte monitoare oficiale pentru exemple, cum ar fi Monitorul Oficial 52/1990.

Formule matematice

Software-ul MediaWiki oferă două modalități de introducere a formulelor matematice: cu TeX (delimitate prin sintaxa <math>...</math>) sau cu HTML (delimitate prin sintaxa {{math|...}}). La Civvic.ro, folosim întotdeauna modalitatea TeX. Manualul MediaWiki oferă o listă de simboluri acceptate, urmată de o serie de exemple simple și complexe.

Note de subsol / Referințe

Monitorul Oficial afișează notele de subsol la sfârșitul fiecărei pagini. Noi vom opta pentru formatul MediaWiki, care afișează notele de subsol la sfârșitul documentului, sub numele de „referințe”. Sintaxa este următoarea:

Aici este un text<ref>aici este o notă de subsol.</ref>

... (restul documentului) ...

== Referințe ==

<references/>

Subliniem că

  • Există o singură secțiune de referințe, la sfârșitul documentului (nu câte una pentru fiecare notă sau act).
  • Textul notei de subsol se include chiar în text, în locul unde apare marcajul de notă de subsol.
  • La sfârșitul documentului se include doar eticheta <references/> care generează codul HTML potrivit.
  • Referințele au o secțiune specială.
  • Desigur, dacă nu există referințe, atunci această secțiune va lipsi
  • Exemplu: Monitorul Oficial 48/1990

Semnături

Fiecare act se încheie cu semnătura autorului. Pentru a produce o semnătură, folosiți unul din șabloanele de mai jos:

Formatul Semnătura produsă
{{SemnPr|Ion Iliescu|București|2 iulie 1992|5}}

Președintele României, Ion Iliescu | București, 2 iulie 1992 | Nr. 5.

{{SemnPm|Petre Roman|București|10 ianuarie 1990|35}}

Prim-ministru, Petre Roman | București, 10 ianuarie 1990 | Nr. 35.

{{SemnLege92|FelAct=lege|dataSenat=16 decembrie 1992|presSenat=academician Alexandru Bîrlădeanu|dataAd=17 decembrie 1992|presCd=Marțian Dan|dataAct=17 decembrie 1992|nrAct=77}}

Această lege a fost adoptată de Senat în ședința din 16 decembrie 1992.

Președintele Senatului, academician Alexandru Bîrlădeanu

Această lege a fost adoptată de Camera Deputaților în ședința din 17 decembrie 1992.

Președintele Camerei Deputaților, Marțian Dan

București, 17 decembrie 1992 | Nr. 77.

{{SemnPsPad|academician Alexandru Bîrlădeanu|Marțian Dan|București|11 iulie 1990|1}}

Președintele Senatului, academician Alexandru Bîrlădeanu

Președintele Adunării Deputaților, Marțian Dan

București, 11 iulie 1990 | Nr. 1.

Avantajul folosirii șabloanelor este că, pe viitor, putem aplica orice prezentare grafică dorim acestor șabloane și ele vor avea efect instantaneu în toate monitoarele oficiale deja procesate.

Puteți consulta lista tuturor șabloanelor definite la Special:Formate_des_folosite. În pagina de "Discuție" asociată fiecărui șablon (sau în pagina Formate pentru semnături aveți exemple pe care le puteți copia, urmând să înlocuiți apoi datele care nu corespund.

Ortografie

  • Spațiere:
    • După semnele de punctuație (.,;:?!) se lasă un spațiu.
    • În exteriorul parantezelor se lasă un spațiu, dar nu și în interiorul lor.
    • În exteriorul ghilimelelor se lasă un spațiu, dar nu și în interiorul lor.
    • Împrejurul cratimei nu se lasă spații.
  • Linii noi: Nu se respectă împărțirea în linii din documentele PDF originale. Fiecare paragraf va fi scris pe o singură linie. Această linie se poate înfășura pe mai multe linii de ecran datorită limitei de lățime a ferestrei de editare din MediaWiki. Între două paragrafe se va lăsa o linie goală.
  • Despărțirea în silabe: Nu se folosește. La procesarea automată a documentelor PDF am încercat să lipim la loc toate cuvintele despărțite în silabe. Dacă mai observați scăpări, vă rugăm corectați-le.
  • Ghilimele: Folosim ghilimelele românești („text”). Cel mai probabil, maparea românească de tastatură pe care o folosiți pentru diacritice include și o metodă rapidă de a tasta aceste ghilimele.
  • Numere: Numerele trebuie întotdeauna transcrise în formatul 1.234.567,89 (fiecare grup de trei cifre în stânga virgulei este delimitat prin punct). Excepție fac anii, care sunt notați fără punct: 1989, 2011.
  • Folosim scrierea curentă, cu â. Documentele PDF până în 1993 folosesc scrierea veche cu î. Avem un script care face înlocuirea în masă î → â. Dacă mai observați erori, corectați-le manual. Excepție fac numele de persoane, care își păstrează scrierea din documentul original.

Exemplu:

Când se sculară spre a merge mai departe, zise Sf. Petrea: „Doamne, fă ca acest izvor să fie ce-a fost mai înainte”. „Amin!” zise Domnul ridicând mâna sa cea sfântă, după care apoi se depărtară înspre mare, fără a mai privi înapoi. (Mihai Eminescu, Făt-Frumos din lacrimă)

Convenții de sintaxă

Dat fiind că folosim un sistem wiki, dorim să aderăm, pe cât posibil, la sintaxa wiki. Ne abatem, așadar de la formatul exact al monitoarelor oficiale, dar numai în ce privește forma. Evident, conținutul nu poate fi alterat în niciun caz.

  • Renunțăm complet la coloane. Teoretic, software-ul OCR pe care îl folosim știe să identifice zonele cu două coloane și să le proceseze în ordinea corectă. Totuși, uneori mai face greșeli, caz în care textul din cele două coloane este amestecat și trebuie corectat manual.
  • Frazele trebuie întotdeauna încheiate cu punct. În multe locuri în documentele scanate, punctul lipsește. Nu suntem siguri dacă aceste erori există în monitoarele originale sau au apărut în urma scanării.
  • Trebuie pus punct după toate abrevierile (alin., art., cap., lit., nr. și altele).
  • De asemenea, trebuie pus punct după toate numerotările. De exemplu, articolele unei legi se numerotează „Art. 1. - ...”, „Art. 2. - ...” etc., cu punct după fiecare număr.
  • Textele cu liniuță la capăt de rând vor fi scrise cu asterisc (*) la capăt de rând, aceasta fiind notația wiki pentru liste neordonate.
  • Textele numerotate vor fi scrise cu diez (#) la capăt de rând atunci când este posibil. Când textul amestecă paragrafe numerotate cu paragrafe nenumerotate, atunci numerele 1., 2., 3. etc. vor fi notate explicit.
  • Textul bold și italic se copiază ca atare. Textul spațiat se copiază ca text normal.
  • Textele scrise cu litere mari sunt convertite la litere mici, eventual cu inițiale majuscule. De exemplu, CAPITOLUL IV → Capitolul IV.

Greșeli în textul original

În cazul în care întâlniți greșeli evidente în textul original, le puteți corecta, cu condiția să inserați o referință în acest sens. De exemplu, în loc de

județul Focșani

puteți scrie

județul Vrancea<ref>Greșeală în original: județul Focșani</ref>

În cazul în care faceți minim o astfel de corectură într-un monitor, nu uitați să includeți la sfârșit secțiunea de referințe:

== Referințe ==

<references/>

Acte diverse

Pentru actele care nu se încadrează într-una din categoriile mari (decrete-lege, decrete, hotărâri ale guvernului etc.), se va crea o secțiune specială, == Diverse ==. Vedeți de exemplu Monitorul Oficial 27/1990. Exemplu:

== Diverse ==

=== Rectificare === 

La Hotărârea guvernului nr. 99/1990 ... (restul actului)

Legături interne

Dacă un Monitor Oficial face referire la alt monitor oficial, vă rugăm să puneți o legătură internă conform sintaxei MediaWiki, incluzând, pe cât posibil, actul exact la care se face referire. De exemplu, M.O. 73/1990 face o rectificare în M.O. 66/1990. Textul în M.O. 73/1990 este:

În Decretul-lege nr. 145/11 mai 1990, publicat în [[Monitorul_Oficial_66/1990#Decret-lege_pentru_stabilirea_unor_m.C4.83suri_privind_pensiile_avoca.C8.9Bilor|Monitorul Oficial nr. 66 din 12 mai 1990]] (pag. 2), la articolul 1, rândul 4 se va citi, în loc de „Decretul-lege nr. 128/1990", „Decretul-lege nr. 129/1990”.

Desigur, numărul paginii și rândul nu mai sunt relevante. Tocmai de aceea, este important să puneți o legătură către actul exact. Pentru a trimite la o secțiune anume a unei pagini wiki, folosiți caracterul # ca în exemplul de mai sus.

La final

Când ați terminat tehnoredactarea unui document, reveniți la admin.civvic.ro, navigați la document și marcați-l drept complet.

Pentru motive statistice, vă rugăm să indicați și gradul de dificultate al documentului. Dificultatea este un criteriu subiectiv, care ia în considerare factori ca:

  • Numărul de tabele din document. Tabelele sunt mult mai greu de tehnoredactat deoarece (a) necesită mai mult efort manual și (b) programul OCR folosit nu se descurcă bine cu tabelele. De exemplu, M.O. 70/1990 are dificultate ridicată.
  • Densitatea de greșeli făcute de programul OCR. Uneori, sistemul OCR identifică greșit formatul paginii, amestecând coloanele sau făcând greșeli de altă natură care fac inutilizabil textul preprocesat. Acele zone trebuie dactilografiate manual, ceea ce sporește dificultatea documentului.
  • Densitatea de informații de pe pagină. Unele documente au acte scurte, aerisite, pe o singură coloană (M.O. 63/1990). Acestea sunt mult mai ușor de procesat decât actele lungi, pe două coloane (M.O. 87/1990).
  • Numărul de pagini goale de la sfârșit. Sistemul contorizează numărul de pagini din documentul PDF, dar adesea ultima pagină este goală. O pagină goală dintr-un total de 8 reprezintă o reducere considerabilă a dificultății (M.O. 13/1990).
  • Dificultatea nu are legătură cu numărul de pagini. Un document poate să aibă 4 pagini și să fie catalogat cu dificultate ridicată, sau să aibă 32 de pagini și să fie catalogat cu dificultate scăzută.

Vă mulțumim!