PT-PG PergFreq dos Voluntários

Do Project Gutenberg, o primeiro produtor de livros electrónicos (ou livros eletrônicos) grátis.

Jump to: navigation, search

Contents

Acerca do Básico

V.1. Como começo a ser um voluntário do Project Gutenberg?

Aquilo que você realmente necessita de fazer para produzir um texto para o PG pode ser exposto muito simplesmente:

  1. Peça emprestado ou compre um livro elegível.
  2. Envie-nos uma cópia da frente e verso da folha de rosto e espere por um OK.
  3. Transforme o livro num texto electrónico.
  4. Envie-no-lo.

E é isso! Todas as restantes partes das PregFreq relativas à produção tratam-se de pormenores de como as diferentes pessoas abordam estes passos.

Cada pessoa encontra o seu próprio rumo dentro do trabalho do PG, encontra os seus próprios nichos. Se você tem as suas próprias ideias, não deixe que nada aqui o impeça de as perseguir.

A maioria das pessoas, agora, começam por se registar no Distributed Proofreaders http://www.pgdp.net, ou no Distributed Proofreaders Europe http://dp.rastko.net, revendo uma página ou duas, e continuam a partir daí.

Algumas pessoas, lêem simplesmente as PergFreq, sobem ao sótão, retiram um livro elegível da prateleira, enviam-nos a FR&V [V.25.] e começam a digitar ou a digitalizar. A próxima vez em que ouvimos alguma coisa delas é quando nos enviam [V.46.] o livro electrónico final para postagem. Pode ser tão simples quanto isto.

Algumas pessoas limitam-se a descarregar textos do PG já existentes, revêm-nos novamente muito atentamente e enviam as correcções.

Algumas pessoas encontram colaboradores regulares pela gutvol-d ou em sítios de revisão distribuída, ganham reputação como revisores fiáveis e continuam a trabalhar como revisores.

A maior parte das pessoas começam com coisas pequenas e, após alguma experiência de revisão distribuída ou de outro tipo de revisão, começam as suas carreiras no Project Gutenberg como produtores.

Se você for dactilógrafo, anime-se, pois pode ignorar toda a parafernália complicada de interfaces de computador e digitalizadores e a qualidade do OCR e os erros que este comete. Pode simplesmente sentar-se ao teclado com o seu livro elegível [V.18.].

Se você não for dactilógrafo, comece a pensar em digitalizadores. Pode demorar ainda algum tempo até que esteja pronto para ser você próprio a digitalizar, mas nunca é cedo demais para se informar acerca deles.

Assim que tiver um domínio sólido de como transformar um livro num texto electrónico, por favor comece a pensar em de que modo se irá tornar num produtor. Embora o trabalho de revisão seja valioso, o PG só pode adicionar livros quando alguém faz o esforço de realmente criar textos electrónicos a partir deles, e as pessoas que gerem projectos de revisão distribuída ou cooperativa têm de fazer montes de trabalho antes e depois do passo da revisão; queremos divulgá-lo tão amplamente quanto possível. O Project Gutenberg precisa de mais produtores!

Independentemente do que fizer, se estiver a trabalhar fora de um projecto de Revisão Distribuída, não ande por aí simplesmente à espera que alguém lhe ofereça uma tarefa para que você se encarregue dela. Não existe nenhuma "sede" onde o pessoal com excesso de trabalho necessite ocasionalmente de estagiários para fazer arquivamentos e trabalhos temporários. Existem talvez cerca de 200 colaboradores relativamente regulares no PG, produtores e revisores significativos. Nós, praticamente, nunca nos encontrámos pessoalmente. Temos trabalhos, famílias e outros interesses. Trabalhamos para o PG quando podemos e quando queremos. Em muitos aspectos, poderá olhar para nós como 200 pessoas sem relações entre si, cada um fazendo o seu próprio projecto de texto electrónico, usando o Project Gutenberg como um grupo de "guarda-chuva" que define padrões flexíveis, arquiva provas de direitos autorais e fornece um local seguro para os textos concluídos. Como temos as nossas tarefas auto-destacadas unipessoais, não existe muito espaço para delegar algum desse trabalho num principiante. Definitivamente, voluntarize-se para algumas das nossas tarefas — no Painel de voluntários, ou na gutvol-d — mas deverá pensar em termos de definir as suas próprias tarefas e de dar o seu próprio contributo.

Orientação.

Absolutamente toda a gente — digitalizadores, dactilógrafos, revisores — deverão antes de mais ocupar algum tempo num projecto de revisão distribuída ou cooperativa. Isto permitir-lhe-á ter uma sensação do que acontece ao fazer um texto electrónico a partir de um livro em papel, sem o comprometer a mais do que algumas horas de trabalho.

Esta não é de modo algum uma exigência institucional, uma vez que não temos nenhumas exigências institucionais, mas é um conselho muito bom. Muitos voluntários começam ansiosamente, querendo fazer montes de trabalho do PG, e depois desistem porque comprometeram-se demasiado, muito rápido e sem compreenderam a natureza do trabalho. Não deixe que isso lhe aconteça. Leve as coisas aos poucos.

Veja estes sítios de revisão distribuída:

Distributed Proofreaders do PG: http://www.pgdp.net/
DP-Europe: http://dp.rastko.net

e passe algumas horas, durante algumas semanas, processando apenas e efectivamente algumas páginas.

Ambos estes sítios são muito semelhantes e ambos podem lidar com qualquer texto, mas embora o Distributed Proofreaders original produza livros em todas as línguas, uma parte significativa da sua produção é em Inglês. Embora o Distributed Proofreaders of Europe produza textos em Inglês, concentra-se amplamente em outras línguas Europeias, Ocidentais e de Leste.

Enquanto faz isso, você deverá também juntar-se a duas listas de correspondência do PG [V.12.] — e à lista do Boletim semanal ou mensal. Lê-las vai começar a deixá-lo ligado ao que se passa. Navegue até ao Painel de Voluntários — podem estar a ocorrer algumas ofertas e há muita experiência retida em algumas das "questões antigas", por isso não se confine à página inicial.

Informe-se sobre os assuntos relativos a textos electrónicos em geral, não só dentro do Project Gutenberg. Explore a The On-Line Books Page (página de livros em linha) [R.5] e encontre outros livros electrónicos disponíveis em linha.

Dê uma espreitadela à nossa Lista Em-Curso e a algumas listas de sugestões de outras pessoas [B.4].

Veja sítios como o Pluckerbooks <http://www.pluckerbooks.com/>, Memoware <http://www.memoware.com> e Bookshare <http://www.bookshare.org> para saber como o nosso trabalho está a ser usado como base em muitos outros projectos, e copiado, e convertido, e ampliado.

Acima de tudo, leia alguns livros electrónicos do Project Gutenberg! Não tem de os ler por inteiro; não precisa de passar semanas a debruçar-se sobre Dostoyevsky ou a estudar Shakespeare. Descarregue simplesmente alguns e passe-os ao de leve -- irá absorver aquilo que um texto do PG deverá ser sem esforço algum, e talvez fique preso pela história! Se está à procura de uma leitura leve e não consegue pensar em nada que queira especialmente, que tal estes favoritos de todos os tempos?:

Se gosta de detectives e mistérios, tem

Para o ondear excessivo de vários marulhos, veja:

Se cê tem deseju de Westerns, tem:

Ou se prefere que a sua ficção seja mais doméstica, tem:

Para algo que o faça rir, pode contar com:

Se a poesia é a sua especialidade, tem montes por onde escolher:

Agora, isto é apenas uma mão-cheia dentro dos nossos mais de 10.000 livros electrónicos, por isso não diga que não consegue encontrar nada para ler! Se tiver as suas próprias ideias, descarregue o GUTINDEX.ALL e navegue pela lista completa ou navegue por autor ("Browse by Author"), no sítio, em <http://www.gutenberg.org/catalog/world/search>.

Descarregue alguns. Leia-os no seu PC, ou reformate-os e imprima-os, ou converta-os para o seu PDA. Vá-se habituando a trabalhar e formatar texto. Repare nas decisões de formatação que os voluntários anteriores tomaram — estas não são inteiramente consistentes; cada pessoa faz as suas próprias escolhas, livros diferentes requerem métodos diferentes, e as convenções do PG foram mudando ligeiramente ao longo dos últimos 10 anos — mas são todos perfeitamente legíveis e convertíveis ainda hoje.

Se você encontrar erros tipográficos [R.26] em algum deles, diga-nos! Isso também faz parte de se ser um voluntário do Gutenberg. Os nossos livros electrónicos melhoram com o tempo!

Se está a pensar utilizar melhor o seu tempo procurando erros nos textos postados, um bom começo será descarregar 40 ou 50 textos e correr um corrector ortográfico e o gutcheck [P.1] em todos eles, gastando apenas 5 ou 10 minutos em cada um. Tendo dado uma rápida olhadela em todos eles, concentre-se naqueles que parecem ter mais problemas — onde os correctores automáticos vêm 10 erros, um humano atento conseguirá apanhar normalmente 20.

Começar a Produzir

OK, portanto, já viu com o que se devem parecer os textos electrónicos, já sabe o que nós fazemos, e a revisão não o afungentou. Chegou a hora de dar um passo em frente e tornar-se um produtor. Se não for um dactilógrafo e não tiver um digitalizador, faça um atalho agora para as PergFreq de Digitalização [S.1] e volte quando o seu digitalizador já estiver preparado. Se for um dactilógrafo ou já tiver um digitalizador, continue a ler...

Arranje um livro. Arranje-o simplesmente, OK?

Tem de começar por algum lado, não é? E encontrar um livro elegível é possível, definitivamente, algures.

Encontrar um livro elegível é um patamar para muitos voluntários iniciantes — é o primeiro grande passo no caminho da produção. Para muitas pessoas, é também a barreira mais difícil que têm de ultrapassar. Felizmente, essa barreira é apenas psicológica, e pode ser ultrapassada em poucos minutos.

É um processo desconhecido e relativamente ao qual alguns voluntários sentem alguma ansiedade. Não sinta. É bastante linear: é apenas comprar um livro — já fez isso, não já? Não pense demasiado sobre isso, não se preocupe se está a fazer a escolha "correcta", não perca meses a comparar listas e a escolher. Compre-o simplesmente. Assim que tiver o seu primeiro, vai perguntar-se para que foi tanta agitação. Graças ás maravilhas da Internet, o seu livro pode estar a caminho em apenas uma hora se você tiver 20 dólares para gastar.

Os dactilógrafos abençoados com uma boa biblioteca local nem sequer têm de comprar os seus livros — podem simplesmente pedir um emprestado e transcrevê-lo! (Pode ser capaz de digitalizar um livro de uma biblioteca, mas adquira alguma experiência de digitalização antes, e evite estragos!)

Tratemos das decisões e algumas outras questões para escolher um.

Direitos Autorais

Para o seu primeiro livro, não tente ser muito imaginativo quanto a direitos autorais. Escolha um que foi publicado antes de 1923 e estará livre de perigo quanto a direitos autorais para o PG e para os EUA. Pode ler as datas tão bem quanto nós -- com livros impressos antes de 1923, não existem armadilhas escondidas: "Pré-1923 é livre". Leia simplesmente a FR&V [V.25] do livro, veja se foi impresso antes de 1923, e não terá problemas. Claro, as reimpressões [V.19] de livros protegidos por direitos autorais pré-1923 (e muitos outros casos) também são claros, mas se tiver algumas dúvidas, fique-se apenas pelas edições pré-1923.

(Nota PT: Se residir em Portugal ou no Brasil, verifique igualmente se o autor morreu há mais de 70 anos, ou estará a violar a lei do seu país. Veja mais detalhes na página PT Direitos Autorais na Lusofonia.)

Que livro?

A resposta a esta pergunta depende de cada pessoa, mas veja o quanto concorda com as seguintes afirmações:

"Tenho um livro favorito e gostaria mesmo de o produzir."

Bem, ouça, isso não é problema! Já sabe o que quer. Vá ver se o livro já está em linha [V.29].

"Gostaria de trabalhar num livro importante, mas não sei em qual."

Bem, a definição de "importante" de cada pessoa é diferente, mas algumas já levaram as suas várias ideias avante; pode ver se concorda com elas! A Lista Em-Curso contém algumas, com a anotação "Suggested book to transcribe" (Livro sugerido para transcrição) ao lado dele. Steve Harris mantém uma lista de possibilidades ainda não produzidas em Steveharris.net. A página "Books Requested" de John Mark Ockerbloom lista títulos que as pessoas pediram. [B.4] O seu problema, se cair nesta categoria, é que as outras pessoas provavelmente também quiseram produzir livos "importantes" e muitos já estão feitos.

"Apenas quero um livro fácil e livre de problemas para começar."

O seu primeiro livro não precisa de ser o Guerra e Paz (para além disso já o temos!) Aqui fica uma dica: tente encontrar livros de crianças ou do que actualmente chamaríamos "Jovens Adultos". São normalmente curtos, podem ter um tipo de letra grande, o que lhe torna a vida muito mais fácil quando o estiver a digitalizar. Envelhecem bem: as histórias de crianças de há um ou mais séculos ainda são legíveis e interessantes para as crianças de hoje. Temos muitos livros electrónicos de crianças e JA: não apenas os clássicos como Grimm e Andersen e Heidi e Oz e Peter Pan e William Tell, mas histórias menos conhecidas mas, ainda assim, encantadoras, como The Counterpane Fairy, ou os Fairy Books de Lang. Existem séries, como as séries Motor Girls, ou (Country) Twins, ou Bobbsey Twins. Existem montes e montes de materiais por onde você pode começar, e estes livros são relativamente abundantes, uma vez que foram feitos para sofrerem o tipo de tratamento que as crianças lhes dispensam, e muitos deles estiveram em bibliotecas de escola e sótãos durante anos.

Independentemente de qual seja a sua escolha, pegue num livro de que vá gostar; viverá com ele próxima e pessoalmente durante algum tempo. Leitura leve, ficção de aventura e livros destinados a leitores mais jovens são primeiras escolhas seguras para a maioria das pessoas. Se você gosta dos cientistas e académicos do século XIX e quer imortalizar as suas obras, óptimo! Mas não sinta que tem de megulhar num poço sem fundo apenas porque alguém quer.

Obter o seu livro: um exercício prático

A pesquisa

Por esta altura, você tem uma lista de livros — talvez apenas um, talvez vários de um autor ou dois, talvez apenas um género como "Livros Infantis" com algumas ideias específicas. Talvez a sua mente ainda esteja em aberto.

Antes das livrarias de livros usados terem a Internet, encontrar um livro antigo em particular era um trabalho desanimador. Os alfarrabistas tinham redes informais entre eles e trocavam catálogos para que cada um soubesse o que estava disponível noutros lugares mas, para um comprador, encontrar um livro em concreto era ainda uma questão de sorte. Contudo, agora, um sem-número de grandes sítios fornecem serviços para os alfarrabistas, nos quais eles podem listar os seus inventários para que as pessoas os procurem a partir de qualquer lugar.

Por isso, nós agora caçamo-los na Internet. Não, você não tem de os comprar na Internet — pode rebuscar em feiras do livro e vendas de garagem e livrarias de livros usados, e isso também tem a sua piada apesar de, numa caçada física, você precisar de levar consigo uma lista com os livros "já produzidos". Mas mesmo que você nunca faça compras na Internet, é uma fonte muito rápida de informação acerca de quais os livros que estão disponíveis, que são muitos, e de quais são os mais baratos. Dá-lhe alguma experiência naquilo que poderá esperar quando fizer a sua inspecção em pessoa.

Aqui fica uma narração de uma caçada típica pela Internet. E você pode segui-la a partir de casa. :-) Os seus resultados, e os sítios nos quais acaba, serão diferentes dos meus mas mesmo que você não acabe a comprar um livro nesta caçada, irá obter alguma experiência sobre o que está em jogo. Vamos, faça-o comigo — veja se consegue encontrar uma pechincha melhor!

Começo com duas listas e vou seguir o que me parecer promissor. Gostava de gastar cerca de 20 dólares — talvez vá até aos 30 dólares. Definitivamente, não estou interessado em 50 dólares ou mais. Estou a ter em conta que vou ter de acrescentar um pouco para a entrega — geralmente até os 10 dólares nos EUA, mas pode ficar caro se você estiver em Perth e encomendar algo numa livraria de Munique.

Também vou evitar nesta pesquisa tudo o que possa parecer complicado de clarificar e vou cingir-me a livros impressos antes de 1923.

Claro que, na altura em que você ler isto, alguns destes livros podem já ter sido produzidos. Por isso, se está de facto a pensar em comprar algum, confirme primeiro atentamente!

A minha primeira lista curta consiste em livros que chamaram a minha atenção na Lista Em Curso de David Price, do sítio de Steve Harris e da página The On-Line Books Requested [B.4] e é assim:

Para além de seguir a minha lista, você deve tentar encontrar, por si próprio, dois ou três livros a partir desses sítios ou das suas próprias preferências, e buscá-los das mesmas formas que eu.

Todas as pessoas têm as suas próprias técnicas de pesquisa e os seus sítios favoritos para pesquisar. Para esta sessão, vou abrir três cópias do meu navegador — uma para Alibris <http://www.alibris.com>, uma para Abebooks <http://www.abebooks.com>, e uma para o Catálogo da Biblioteca do Congresso <http://catalog.loc.gov>. Vou fazer as minhas pesquisas iniciais no Alibris e Abebooks e manter a LoC ("Library of Congress") à mão para servir de referência.

No Alibris, vou directo à página "Advanced Search" (Pesquisa Avançada), uma vez que eles permitem que se pesquise pela data, e coloco imediatamente "before 1923" (antes de 1923) em todas as pesquisas, o que evita procurar as reimpressões modernas. Na Abebooks escolho "Hardcover" na pesquisa avançada, que não é tão boa como um filtro mas, ao menos, não mostra as brochuras de edições recentes.

Em cada um dos sítios, introduzo simplesmente o apelido do autor e uma palavra do título de cada livro, e olho para os resultados da pesquisa.

O "Inheritance" de Louisa May Alcott parece que vai ser difícil. Não o encontro em nenhuma das minhas duas livrarias. Ao fazer uma pequena busca em livrarias modernas, descubro que foi o seu primeiro romance, escrito quando ela tinha 17 e, tanto quando consigo perceber, não foi publicado durante a sua vida: aparentemente, foi apenas publicado recentemente — o sítio da Biblioteca do Congresso (LoC) não tem nada anterior a 1997. Um começo decepcionante para a minha primeira pesquisa. Compreendo que é muito importante tê-lo em linha, mas este vai ser muito difícil de clarificar e vou manter-me longe dele.

O "Irralee's Bushranger" de E. W. Horning também é muito esquivo: não aparece em nenhum dos meus sítios por isso vou ver à LoC para confirmar se tenho o título certo e, sim, ali está ele: "Irralee's Bushranger, a story of Australian adventure, 1896." Por isso, alargo a minha pesquisa visitando <http://www.trussel.com/f_books.htm> e pesquisando muitos dos sítios de lá. Ainda sem sorte. Se eu estivesse particularmente ávido por obter este livro, existem muitas coisas que podia fazer nesta altura: Podia registar um pedido ("want") num dos sítios a pedir para ser notificado quando uma cópia fosse listada, podia usar a pesquisa OCLC WorldCat (à qual a Abebooks chama "Find it at a local library") na qual posso localizar bibliotecas que tenham cópias, ou poderia até contactar algumas livrarias individuais e perdir-lhes que o procurem por mim. Algumas livrarias especializam-se realmente em pesquisar livros difíceis de encontrar; mas, claro, prevejo que tivesse de pagar um pouco mais pelo livro quando o encontrassem e, tendo em conta o meu sucesso com o resto da minha lista, e a minha bitola de preços, não parece ser necessário ir tão longe por hoje.

O "Stingaree" de Horning, ao contrário, parece estar em todo o lado, em várias edições, e barato. Deve ter sido um sucesso de vendas no seu tempo — o que não é surpreendente, do autor de "Raffles". As edições de 1902, 1905, 1909 abundam. As mais baratas são as edições de 1910 e 1907, por 4,95 e 5,00 dólares nas livrarias listadas na Abebooks.

O "Dover Road" de Milne está disponível em ambos os sítios. Parece ter havido uma impressão de Putnam em 1922 das "Three Plays: The Dover Road. The Truth About Blayds. The Great Broxopp." das quais montes de cópias sobreviveram. Também parecem existir impressões mais tardias que se qualificariam como reimpressões se eu estivesse desesperado, mas a edição de 1922 tem preços de 12,00 a 50,00 dólares, por isso vou comprar a cópia de 1922 por 12,00 dólares na Abebooks. Como bónus, não vejo nenhuma outra edição de duas peças listada como estando em linha em sítio algum, por isso, vou comprar três textos (e curtos, também! — 279 páginas para os três) pelo preço e esforço de um.

O "Once on a Time" de Milne é menos comum mas, novamente, uma impressão de Putnam de 1922 mantém-no na corrida. Existem algumas livrarias em Inglaterra que as vendem por 15 libras (o que perfaz praticamente o meu limite de 20 dólares) e 20 libras, e uma cópia de uma ex-biblioteca disponível por 25 dólares.

Existem montes de cópias elegíveis de "Pamela" disponíveis, variando entre a quarta edição a uns meros 4,999 dólares (não, obrigado!) a uma impressão de 1921 por 6,60 dólares na Alibris. Vou levar esta, por favor.

O "Critic as Artist" de Wilde está razoavelmente disponível com largueza. Uma edição de 1905 de "Intentions: the Decay of Lying; Pen Pencil and Poison; the Critic as Artist; the Truth of Masks" está disponível na Alibris pos 8,80 dólares, (e outras cópias da mesma edição aí e no Abebooks no espaço entre 20-30 dólares) e o Abebooks lista uma edição de 1919 em Londres por 12,50 dólares. Existem várias cópias listadas em ambos os lugares como não datadas ("undated") e reimpressões ("reprints") — vou evitar estas uma vez quem apesar de ser bastante provável que possam ser desobstruíveis, não vou correr riscos nesta pesquisa.

A minha segunda lista não é uma lista — apenas uma categoria vaga: livros infantis que são fáceis de fazer.

Vou à pesquisa avançada ("Advanced Search") da Alibris e introduzo "Child's" no título e "pre-1923" na data, excluindo os títulos já em linha, e obtenho imediatamente:

e por aí em diante, ao longo de uma lista significativa.

OK. É um bom começo. Mas a minha escolha, até agora, não é imaginativa. Preciso de melhores termos de pesquisa. Por isso vou aos principais motores de pesquisa com os termos "livros infantis antiquário" ("children's antiquarian books") e encontro cerca de meia dúzia de sítios que se especializam neles. Posso navegar por lá, embora seja mais lento prosseguir sem pesquisas que focalizem os meus resultados. Encontro <http://www.bookrescue.com>, que se especializa em livros infantis. Furando pelos quilómetros e quilómetros de Alcotts e Barries e Burnetts, que já estão em linha na sua maioria, acho eu, encontro alguns autores que devem ter sido populares, porque parecem ter publicado montes de livros antes de 1923: Angela Brazil e Dorothy Canfield. (Só cheguei ao "C"!)

Claro que eu podia parar aqui e comprar alguns, mas hoje quero ver o que mais está por aí.

De volta aos Alibris e Abebooks, munido com os meus autores pelos quais pesquisar, deparo-me com 4 livros pré-1923 abaixo dos 20 dólares para Angela Brazil:

e vários entre os 20 e os 30 dólares.

Dorothy Canfield revela imediatamente múltiplas cópias de:

e outros, e eu não cheguei ainda sequer aos 20 dólares, nem à letra "D".

Uma navegação pela secção de livros coleccionáveis e antiquários ("Collectible and Antiquarian Books") da Ebay também despeja uma lista respeitável de elegíveis. Nem me daria ao trabalho de os contar.

Em 20 minutos, encontrei cinco de sete da minha lista de pesquisa. Em menos de uma hora depois, encontrei mais de 16 livros infantis elegíveis, todos abaixo ou por volta dos 20 dólares e todos disponíveis em linha.

Antes de me comprometer com um, todavia, devo confirmar novamente se o livro já não está transcrito em linha e se não está Em Curso.

Confirmar novamente a sua selecção

Se está preocupado que o livro que escolhei duplica um outro que possa estar em curso, e quer confirmar novamente, você pode enviar um e-mail à Equipa de Postagem a pedir-lhes que confirmem se chegaram algumas desobstruções recentes para esse título.

As duplicações acontecem efectivamente — não há forma de as evitar quando pessoas diferentes tomam decisões independentes — mas são raras.

Lidar com alfarrabistas

Enquanto classe, os alfarrabistas são pessoas agradáveis — notavelmente amigáveis, conhecedoras e prestáveis, mesmo para pessoas que compram com um orçamento típico do Gutenberg.

Alguns deles, contudo, não são modelos de uma organização de dados ideal quando se trata de listagens na Internet. Existem montes de actividades de uma ou duas pessoas, que tratam de inventários de milhares de livros e, tendo localizado o seu livro em linha, você deve verificar se este está ainda disponível.

pode colocar uma encomenda no sítio e esperar pela confirmação, ou você pode simplesmente telefonar ao livreiro. Nem todos os detalhes de contacto dos livreiros estão listados por isso isto nem sempre é uma opção mas quando você telefonar é provável que esteja imediatamente a falar com alguém que lhe pode dizer com certezas se o livro ainda lá está, que pode puxar o livro da prateleira e responder a perguntas sobre ele e pode pegar nos seus detalhes do cartão de crédito no local e expedir imediatamente o livro.

Desobstrução de Direitos Autorais

Assim que o seu livro chegar, envie-nos, em primeiro lugar, a informação necessária para a Desobstrução de Direitos Autorais. Mesmo que o seu livro seja completamente, sem dúvidas, uma edição pré-1923, devemos ser informados tão rapidamente quanto possível para que ele possa ir para a lista Em curso para que outros vejam que alguém já começou com ele.

Espere pelo e-mail de confirmação antes de começar qualquer trabalho significativo. Algumas pessoas já pensaram que "Copyright 1923" e mais algum pensamento positivo seriam suficientes e, infelizmente, não são. Algumas pessoas adiantaram-se e produziram todo o livro antes de enviarem o pedido de desobstrução simplesmente para ficarem desapontadas, todo o seu trabalho arruinado.

Os livros publicados em 1922 ou antes são desobstruíveis mas algumas pessoas, sempre optimistas, não vêm bem aquele pequeno "1927" em letras miúdas no verso. Por vezes, não existe data de direitos autorais na frente e outros optimistas supõem que estes livros estão OK. Podem estar; podem não estar. Não se deixe apanhar na armadilha dos direitos autorais.

Assim que você tiver o que pensa poder ser um livro elegível, não comece a trabalhar nele, Não pergunte a opinião de outro voluntário. Envie simplesmente a FR&V e espere pelo e-mail de confirmação para saber com certeza.

Mesmo quando a sua FR&V diz claramente "Copyright 1901", envie-la. Precisamos de pô-la nos ficheiros das desobstruções para podermos registá-la como estando Em Curso.

Produzir

se você for um dactilógrafo, não há muito mais que precise de saber a partir desta altura: pode simplesmente começar com o trabalho e talvez algumas dicas das PergFreq. De facto, se você é um dactilógrafo, pode interrogar-se porque é que o resto de nós fazemos tanto espalhafato com os digitalizadores, e definições, e OCR. tenha pena de nós! nós não conseguimos, simplesmente, produzir da mesma forma que você. Sorria indulgentemente, ignore todo o jargão de digitalização e submeta o seu texto completo enquanto ainda está a dizer palavrões acerca da medianiz numa imagem em escala de cinza da página 372. :-)

Se você está a utilizar um digitalizador para copiar um livro pela primeira vez, tenha paciência consigo próprio. Algumas pessoas começam com expectativas demasiado elevadas quanto ao que conseguem alcançar. Quer acredite quer não, digitalizar funciona eficazmente; simplesmente não funciona na perfeição. E, frequentemente, você precisa de um pouco de prática antes das suas digitalizações funcionarem bem com o seu OCR. As PergFreq de Digitalização [S.1] têm montes de dicas específicas que você pode tentar. Comece por digitalizar uma página dupla a cerca de um terço do livro. Digitalize a Branco e Preto e a Escala de Cinza, a 300dpi e 400dpi. Experimente 600dpi se lhe parecer uma boa ideia. Passe-a pelo seu OCR e veja o que acontece. Mova o seu digitalizador de forma a que você esteja confortável enquanto coloca o livro e vira as páginas. Dê a si mesmo uma hora para experimentar com definições diferentes e páginas diferentes. Passe as imagens de amostra incluídas nas PergFreq de Digitalização pelo seu OCR e veja como o resultado se compara ao texto produzido por outros pacotes. Essa primeira hora a descobrir como as suas definições funcionam será a hora de digitalização mais valiosa que você alguma vez fará.


Tendo decidido que definições você quer utilizar para esse livro, certifique-se que implementa a melhor velocidade que consegue. Normalmente isto significa dizer ao digitalizador para digitalizar apenas a área que o livro cobre. Isto é muito importante uma vez que o digitalizador, como padrão, digitaliza a área inteira e nós não queremos isso, de todo; isso apenas desperdiça tempo e faz as suas imagens maiores.

Você também pode conseguir definir o seu OCR ou programa do digitalizador pra auto-digitalizar as páginas com algum atraso predefinido, como 5 segundos, Isto também acelera as coisas uma vez que o digitalizador não vai esperar que você carregue no teclado e você terá sempre ambas as mãos livres para virar a página e recolocar o livro. São necessárias algumas páginas para entrar no ritmo; se você falhar uma viragem de página, não se preocupe — pode colocá-la na próxima digitalização.

Utilizando um digitalizador de mesa do tipo de casa ou de escritório razoavelmente moderno, você deve ser capaz de digitalizador 200 páginas por hora [S.9] para um livro típico a boa qualidade. 400 páginas por horas não é inaudito. Agora, podemos dizer sinceramente que digitalizar oferece todo o divertimento de engomar, sem o espírito de aventura :-), mas se você configurou bem as suas definições, conseguirá provavelmente fazer todo o trabalho em menos de duas horas. E agora você está mesmo com o pé na estrada!

V.2. Que experiência preciso de ter para produzir ou rever um texto?

Nenhuma.

Para produzir, tem de saber digitar bem ou ter um digitalizador.

Para rever o texto de outra pessoa, quando não tem uma cópia do livro à sua frente, deve estar razoavelmente faliliarizado com a língua utilizada no livro e os estilos da época -- o Inglês de Chaucer era bastante diferente do actual, e mesmo os romancistas do século XIX escreviam algumas orações que hoje não nos são familiares.

E é isso. Não precisa de ter experiência em publicação, edição ou computadores.

V.3. Como produzo um texto?

Existem toneladas de palavras sobre isso nas PergFreq, mas tudo se resume a 4 passos simples:

  1. Arranje um livro elegível — pré-1923, ou uma das outras excepções. Retire-o do seu sotão, peça-o emprestado a uma biblioteca ou a um amigo, compre-o na sua livraria local, numa feira da ladra ou em linha. Não nos interessa onde.
  2. Envie-nos uma cópia do verso e reverso da folha de rosto para podermos fichar uma prova da desobstrução de direitos autorais.
  3. Copie o texto do livro para um ficheiro de texto de computador. Não queremos saber se o digita, se o digitaliza, se o dita por voz, ou se pensa numa forma totalmente nova de o fazer. Simplesmente, ponha-o num ficheiro.
  4. Envie-nos o ficheiro de texto de computador.

É tudo o que é preciso!

V.4. Preciso de algum equipamento especial?

Precisa de usar algum tipo de computador, e um acesso à Internet é habitual, apesar de já termos tido alguns voluntários que contribuiram com os seus textos em disquetes.

Se tenciona digitalizar livros, irá precisar de um digitalizador, mas não precisará se estiver apenas a digitar ou a rever.

V.5. Preciso de saber programar?

De modo nenhum! Muito pouco do trabalho do Project Gutenberg envolve programação, e nunca é necessário para nenhuma parte do voluntariado.


V.6. Eu sou um programador e gostaria de ajudar programando. O que posso fazer?

Veja a Tools FAQ.

V.7.O que faz realmente um voluntário do Project Gutenberg ?

Nós compramos ou pedimos livros elegíveis, digitalizamo-los, digitamo-los, e revêmo-los. Há algumas outras actividades, mas que consomem apenas uma fracção muito pequena do tempo voluntário.

V.8. Posso produzir um livro na minha própria língua?

Sim! Queremos encorajar as pessoas a produzir livros em todas as línguas, e alegramo-nos quando podemos adicionar uma nova língua à lista.


V.9. Tem de ser um livro? Posso produzir peças de uma revista ou outro periódico?

Revistas, jornais e outras publicações servem perfeitamente. Para desobstrução de direitos autorais, funcionam exactamente como um livro.

Você precisa, na verdade, de confirmar o comprimento da sua peça [V.17]; não queremos ziliões de peças separadas ou ficheiros de duas páginas. Se a peça que tem em mente não é suficientemente grande, pode adicionar-lhe outras peças, ou até mesmo a maior parte da revista. Se a obra foi seriada em múltiplas edições, pode juntá-las a todas no seu texto do PG, mas tem de desobstruir os direitos autorais de cada edição da revista da qual copia o material.

Já temos muitas cópias de periódicos postadas no PG, incluindo os Scientific American, The Mirror, e Punch.

Se tem montes de periódicos antigos, pode até pegar numa peça de entre as muitas e fazer um novo texto que seja um antologia "temática" dessas peças. Pode dar-lhe um título apropriado: "Comentários sobre a Guerra Civil de X revistas 1892-1898."

V.10. Tenho que produzir um texto puro em ASCII?

Certamente que não se isso não fizer sentido. Para pegar num exemplo extremo, se estiver a trabalhar em Japonês ou Árabe, ou a criar ficheiros de áudio, não serve de nada tentar reproduzi-los em ASCII!

Quando o texto possa ser largamente expresso em ASCII, queremos, de facto, uma versão ASCII, mesmo que ela fique de algum modo degradada se comparada com o original. Contudo, postaremos o seu ficheiro em tantos formatos abertos quantos os que você criar, para que o trabalho original fique disponível para aqueles que têm os programas necessários para o ler.

V.11. Onde assino para ser voluntário?

Não assina. Não temos nenhum processo formal de inscrição, nem lista de voluntários, nem chamada. Se produzir um livro electrónico para o PG, ou ajudar a produzir um, você é um voluntário.

V.12. Como é que os voluntários do PG comunicam entre si, se mantêm em contacto e coordenam o trabalho?

Nós estamos muito dispersos geograficamente: EUA, Austrália, Brasil, Formosa, Alemanha, África do Sul, Itália, Índia, Inglaterra, e por todo o Mundo, por isso não nos podemos propriamente encontrar para um café ás quintas-feiras . :-)

A maior parte da cooperação e coordenação decorre por emails privados. Isto é eficiente para os voluntários que já trabalharam antes entre eles, uma vez que conhecem os interesses e competências de cada um, mas não é tão fácil para os iniciados começarem, uma vez que os outros não os conhecem.

Existem algumas listas de correspondência do Project Gutenberg.How to subscribe to our mailing lists.

Os Boletins Semanais e Mensais do Project Gutenberg, gweekly e gmonthly, são anúncios de um só sentido, que permitem ao PG comunicar com não-voluntários que se interessam pelos livros electrónicos que nós produzimos, mas também contém avisos e pedidos de assistência dos voluntários.

A Lista de Correspondência para Discussão dos Voluntários, gutvol-d, é um fórum de discussão por email para os seus subscritores acerca de qualquer assunto do Gutenberg.

A Lista de Voluntários, gutvol-l, serve para anúncios privados para voluntários no activo.

Oa Fóruns do DP nos sítios Distributed Proofreaders centram-se sobretudo nas questões do DP, mas são vivos e interessantes: http://www.pgdp.net/phpBB2/ e http://dp.rastko.net/phpBB2/.

Existem outras listas fechadas, especializadas, para as pessoas que fazem um trabalho específico dentro do PG:

A Lista de Postados, posted, destina-se a pessoas que realizam a indexação dos nossos textos. É enviado um email para esta lista cada vez que postamos um texto (veja a FAQ "How does a text get produced?" [V.16] section 5: Notification) e os membros da lista usam-na para actualizar os seus catálogos.

A Lista dos Whitewashers, pgww, destina-se a mensagens internas da Equipa de Postagem.

V.13. Onde posso encontrar uma lista dos livros que precisam de revisão?

Não existe nenhuma lista central desse tipo. Existem projectos de revisão distribuída, actualmente em

Distributed Proofreaders do PG: <http://www.pgdp.net/>
DP-Europe: <http://dp.rastko.net>

onde você pode rever partes de um livro. Isto é aconselhável quando acaba de começar porque lhe dá alguma sensação de como é o trabalho.

Também pode procurar nos arquivos por textos postados já existentes e revê-los. Tal como parece existir sempre mais um defeito em cada programa, parece existir sempre mais um erro tipográfico em cada texto! Descarregue alguns, e sonde-os rapidamente em busca de erros, fazendo uma verificação ortográfica ou outra verificação automática; se conseguir encontrar problemas rapidamente, então há provavelmente outros a ser descobertos por uma revisão atenta.

V.14. Existe alguma lista de livros que o Project Gutenberg quer?

Não. O Project Gutenberg, enquanto tal, não "quer" nenhuns livros específicos. São os voluntários, individualmente, que escolhem que livros querem produzir. Ninguém dá ordens aos voluntários acerca daquilo em que eles deveriam trabalhar. Ninguém tem uma "lista de êxitos" oficial de livros a adicionar aos arquivos.

Claro que os voluntários e não-voluntários, individualmente, têm as suas preferências e podem sugerir livros a transcrever, e essas listas de sugestões surgem de vez em quando, e são muitas vezes úteis para as pessoas que procuram ideias.

Existem habitualmente algumas sugestões na Lista Em-Curso de David Price. A On-Line Books Page tem uma secção na qual as pessoas podem listar pedidos, e Steve Harris tem um sítio dedicado a listas de livros ainda não no Gutenberg ou noutros sítios. Trate todas estas listas com alguma cautela, uma vez que alguém pode já ter começado ou até mesmo terminado alguma das suas sugestões desde que foram actualidas pela última vez.

Livos do PG Em Curso <http://www.dprice48.freeserve.co.uk/GutIP.html>
Lista Em Linha de Pedidos <http://onlinebooks.library.upenn.edu/in-progress.html#requests>
Afazeres de Steve Harris <http://www.steveharris.net/PGList.htm>

V.15. Tenho um livro com o qual gostaria de contribuir. Posso fazê-lo sem me inscrever?

Bem, uma vez que não existe nenhuma inscrição formal, claro que pode! Montes de textos foram fornecidos por pessoas que apenas queriam imortalizar um livro favorito. Muitas delas tinham já criado o livro electrónico antes mesmo de terem ouvido falar do Project Gutenberg, e ficamos sempre encantados ao adicioná-los ao arquivo!

Acerca da produção

V.16. Como é que um texto é produzido?

Como expresso acima na secção Básico, tudo o que você precisa de fazer é:

É tudo o que você precisa efectivamente de fazer para ser um produtor. Mas se você estiver interessado em saber detalhes de como as outras pessoas fazem isto realmente, e quer saber o que mais acontece nos bastidores, aqui fica um relato completo e pormenorizado.

1. Encontrar um livro elegível

Os voluntários encontram os livros elegíveis [V.18] por todo o tipo de maneiras. Algumas pessoas com sorte têm-nos nas suas prateleiras ou no seu sótão. Muitas pessoas têm uma boa biblioteca perto delas, onde podem encontrar livros, ou pedi-nos no empréstimo inter-bibliotecas. Algumas pessoas são grandes fãs do eBay; outras gostam de caçar pechinchas em portais de livros da especialidade. E, claro, montes de voluntários apreciam rebuscar em livrarias de usados reais, ou mercados locais ou vendas de quintal.

Mesmo que você não vá empreender num livro agora, pesquise por alguns na Rede e descubra como obter uma cópia. Na próxima vez que passar por um livreiro antiquário, ou uma feira do livro, entre e espreite. Pergunte na sua biblioteca local pelos empréstimos inter-bibliotecas. Os livros elegíveis não são difíceis de encontrar assim que você saiba onde procurar.

2. Desobstrução de Direitos Autorais

Os voluntários novos por vezes têm dificuldade em compreender porque é tão importante e , em especial, porque o Project Gutenberg é tão previdente quanto a isso. Basicamente, é simples: ao mantermos arquivada uma cópia da FR&V [V.25] de cada livro que produzimos, podemos a todo o momento proteger as nossas publicações contra as reclamações dos editores de que "detêm" a obra e portanto podemos disponibilizá-las ao público.

As leis de direitos autorais podem ser difíceis de entender e por vezes pode ser necessária uma séria investigação para provar que uma edição em particular está realmente no domínio público. Se você não está inclinado para as questões legais, vá repetindo para si "Pré-23 está livre" se estiver nos EUA e cinja-se a livros publicados antes de 1923. Se quiser ir mais a fundo, leia as nossas regras de Direitos Autorais em <http://www.gutenberg.net/howtos/copyright-howto> e depois prossiga com uma leitura da documentação oficial do Gabinete de Direitos Autorais da Biblioteca do Congresso dos EUA em <http://www.copyright.gov/>. Se estiver noutro país, descubra quais são as suas próprias leis de direitos autorais.

Os voluntários enviam-nos a FR&V do livro para que nós a inspeccionemos. Isto não só nos dá uma prova para arquivarmos, como também nos permite saber que alguém está trabalhando realmente no texto de modo a que o possamos listar como estando Em Curso para servir de informação a outros que possam estar interessados.

3. Digitalizar, digitar, rever e editar

Isto perfaz o núcleo do esforço do PG e está discutido em grande extensão noutros lugares nestas PergFreq. Existem muitas, muitas, maneiras de criar um texto electrónico a partir de um livro de papel e pessoas diferentes usam métodos diferentes, mas tudo se resume a fazer um ficheiro de texto. Para um livro típico, ocupará em média 40 horas do tempo de um voluntário. Tudo o que se passa aqui é que alguém faz o esforço de transcrever um livro em papel para um ficheiro que possa ser partilhado por todo o mundo para sempre.

Desde "O Episódio Slashdot", quando o Distributed Proofreaders foi retratado no Slashdot, um sítio popular de notícias técnicas, a maior parte da produção do PG passa pelo DP. As fases de produção estão aí mais regulamentadas, mas é a mesma fórmula básica de digitalizar, OCR, rever. A grande diferença é que ninguém tem de fazer tudo.

4. Postar

[Nota: esta informação é bastante específica do processo pelo qual passamos agora. É bastante provável mudar à medida que melhorarmos a automatização das tarefas.]

A postagem é feita pela nossa Equipa de Postagem. O trabalho básico é receber o texto do produtor, confirmar se ele foi desobstruído de direitos autorais, verificar se está de acordo com os padrões do Project Gutenberg , verificar a sua correcção (que pode ir desde a validação do XML até à simples ortografia), adicionar o cabeçalho do Project Gutenberg e copiar o texto para os dois servidores do PG.

Num caso simples, em que tudo está bem, isto pode demorar tão pouco quanto quinze minutos. Num caso complicado, em que temos de converter formatos, ou há muitos erros no texto, ou problemas com a desobstrução de direitos autorais, isto pode demorar horas ou até dias enquanto esperamos por respostas, ou fazemos montes de edições, ou encontramos as ferramentas de conversão.

O Michael Hart costumava fazer isto completamente sozinho mas, em Setembro de 2001, criou a Equipa de Postagem para tratar do carregamento. (A Equipa de Postagem é apelidada de "Whitewashers" , em honra das vítimas de Tom Sawyer. :-)

Transferir o ficheiro

Você envia-nos o texto [V.46] seja pela rede, por FTP (com um nome de utilizador e uma palavra-chave que qualquer pessoa da Equipa de Postagem lhe poderá dar confidencialmente), ou por correio electrónico.

Se estiver a enviar por FTP, também deve enviar um e-mail para um ou mais de nós, para sabermos o que você carregou.

Um problema é que os ficheiros não se transferem correctamente. Especialmente por e-mail, alguns ficheiros ficam danificados pelo caminho. É melhor comprimir o ficheiro antes de o enviar, se possível, para evitar alguns problemas comuns com os ficheiros de texto. O uso de formatos da compressão que não o ZIP também pode criar problemas. Os membros da Equipa de Postagem trabalham em plataformas variadas &mdash DOS, Windows, Linux, Solaris &mdash e os programas de compressão e descompressão ZIP estão geralmente disponíveis para todos estes. Outros métodos de compressão, como Stuffit ou bzip2, não estão tão prontamente disponíveis e podem dar-nos problemas.

Ligamo-nos via ssh a pglaf.org, que é o sistema Unix no qual trabalhamos quando postamos, o mesmo para o qual você carregou o ficheiro, descomprimimos o ficheiro e passamos os olhos para o seu início.

Confirmar a Desobstrução.

Então confirmamo-lo quanto à desobstrução de direitos autorais. A única regra absoluta a que nunca nos desviamos, aconteça o que acontecer, é que nunca postaremos um ficheiro que não tenha uma desobstrução. Se ele não está nos ficheiros das desobstruções, não será postado.

A maior parte dos produtores habituais sabe que devem incluir a sua linha de desobstrução no formulário da Internet ou no e-mail ao submeterem o texto, mas nem todos fazem isto e nem todos se lembram sempre. Isto pode ser frustrante, quando a desobstrução não é incluída ou não é óbvia.

Quando recebeu a sua desobstrução de um livro, você recebeu aquilo a que chamamos uma "Linha de Desobstrução", qualquer coisa como isto:

The Works Of Homer [Iliad/Odyssey] Tr. George Chapman Jim Tinsley 06/14/01 ok

são salvas em ficheiros a que nós os postadores podemos aceder. Consideramos esta informação como privada, por isso não publicamos os pormenores de quem desobstruiu o quê.

Quando obtemos um texto, confirmamos se quem o submete o desobstruiu. Se estiver uma linha de desobstrução no e-mail notificando-nos acerca do texto, não há problema. Se conseguirmos encontrar o título do texto por baixo do nome de quem o submete nos ficheiros das desobstruções, não há problema. Infelizmente, por vezes não o conseguimos encontrar. Existem duas razões habituais: ou o texto submetido é parte da obra desobstruída (por exemplo, submeter uma peça de uma colectânea), ou o texto não foi ainda desobstruído. Se a desobstrução não for directa, podemos andar para a frente e para trás e ás voltas nos e-mails durante algum tempo.

É por isso que é importante colar a linha de desobstrução no formulário da internet e que você usa para carregar o seu texto, ou no e-mail, se por alguma razão você não conseguir usar o formulário da Rede.

Se o título do texto que você estiver a enviar não for o mesmo que o título do texto desobstruído, ASSEGURE-SE que cola a linha de desobstrução E que explica que o texto que está a enviar é uma PARTE do livro desobstruído. Por favor, liste igualmente os títulos das outras partes; causa, mesmo, confusão e atraso quando isto não está claro.

Verificar e Editar

Por vezes, as pessoas enviam um livro num formato que não de texto puro, como Word Perfect ou Microsoft Word, ou enviam um texto com as linhas desembrulhadas. Nesse caso, tentamos pedir a quem os envia que os corrija, mas se não conseguirem temos de converter o texto para texto plano antes de começar.

Outras vezes as pessoas não respeitam o nosso limite de caracteres por linha, ou outras convenções de formatação.

Alguns produtores, particularmente inexperientes, querem acrescentar anotações e marcações e símbolos não padronizados ao texto. Isto pode tornar-se melindroso; não queremos desencorajá-los, mas precisamos de manter os textos razoavelmente padronizados. Normalmente, conseguimos arranjar uma solução. Talvez o livro devesse ser adicionado tanto no formato de texto como em HTML, por exemplo.

Partindo do princípio que é um ficheiro de texto puro, corremos de seguida o gutcheck e uma verificação ortográfica rápida. Isto dirá imediatamente se o texto adere aos padrões do PG ou se existem nele algum problema sério.

Se o ficheiro parecer bem, podemos limá-lo, procurando erros potenciais ou questões de formatação. Para os textos limpos, as únicas coisas que normalmente precisamos de mudar são os avanços das citações, títulos de capítulo inconsistentes (muitas pessoas parecem misturar "CAPÍTULO III" com "Capítulo 14" e têm um número irregular de linhas em branco) e o espaçamento e uns poucos de caracteres em 8 bits. Ocasionalmente, temos de reembrulhar o texto. Também procuramos marcas registadas de editores incluídas, que preferimos normalmente remover (as marcas registadas NÃO estão sujeitas a caducidade de direitos autorais: Macmillan(TM), a casa de impressão, ainda anda por aí e a comercializar), avanços ou centralizações verticais estranhos ou desnecessários, números de página desgarrados, e prefácios ou introduções ou apêndices que podem não estar em domínio público. Se o ficheiro tiver muitos caracteres de 8 bits provavelmente precisamos de fazer uma versão separada de 7 bits e postar ambas.

Se o gutcheck e o corrector ortográfico não parecer limpo, ou se for precisa uma conversão, podemos passar muito mais de 15 minutos nisso. Num caso mau, podemos precisar que o ficheiro seja revisto novamente.

Se você tiver consciência que está a fazer algo não padronizado e realmente pretende que isso se mantenha, diga-o no seu e-mail. (Por exemplo: eu postei recentemente um texto que continha uma árvore genealógica que tinha linhas com mis de 80 caracteres. Agora, eu podia ter deixado isso em paz na mesma, mas ajudou que quem o submeteu me tenha chamado à atenção para isso no e-mail.) Se fugir muito aos padrões, quem postar pode não permitir que isso se mantenha, mas ao menos você poderá discuti-lo. Quando um texto precisa de muitas formatações ou marcações não padronizadas, você precisa realmente de perguntar a si mesmo se não deveria enviá-lo em HTML, com as minudências todas, e fixe-se em algo mais normal na variante de texto.

Na maioria das vezes, os erros são óbvios e existem pelo menos alguns erros óbvios na maior parte dos textos. Quando os erros são completamente óbvios, nós reparamo-los sem dar retorno ao produtor a não ser que ele tenha especificamente pedido por retorno no e-mail.

Estamos a obter mais formatos HTML agora, o que é óptimo, mas os HTML que chegam geralmente precisam de montes de trabalho porque as pessoas que não estão familiarizadas com HTML cometem erros frequentemente. O W3C <http://validator.w3.org> é o padrão oficial para HTML válido mas, para o voluntário médio, é impraticável. Contudo, se você está a submeter um formato HTML, por favor use o Tidy, que pode obter a partir de <http://tidy.sourceforge.net> para confirmar o seu texto antes de o enviar. Se está a utilizar CSS juntamente com o seu HTML precisa de verificar isso separadamente também no W3C CSS Validator <http://jigsaw.w3.org/css-validator/>.

Cabeçalho e Rodapé

Adicionamos o cabeçalho e rodapé do PG. Se já está lá algum cabeçalho ou rodapé, removêmo-lo em primeiro ligar, uma vez que as mudanças recentes no cabeçalho significam que montes de pessoas enviam ficheiros com cabeçalhos que já estão desactualizados. Escrevemos programas para nos ajudarem nisto.

Obtemos o número do texto a partir de um programa chamado "ticket" que Brett Fishburne escreveu, que salta o número seguinte. Desse modo, se dois ou três voluntários dos nossos estiverem a postar ao mesmo tempo, não vamos todos apanhar o mesmo número. A partir do número, sabemos os nomes de ficheiro, de acordo com as regras para postar 10k listadas em [R.35] e finalmente comprimimos o ficheiro.

Postar

agora transferimos os ficheiros postados para os nossos dois servidores: ftp.ibiblio.org (que também serve como gutenberg.net) e ftp.archive.org. (É normalmente nesta altura em que nos apercebemos que nos esquecemos de fazer uma mudança que notámos durante a verificação. Aaaargh!)

Actualmente, fazemos habitualmente isto carregando os ficheiros num grande comprimido para pglaf.org, no qual uma tarefa agendada coloca automaticamente os ficheiros em ambos os servidores. De momento, isto acontece 20 minutos depois da hora, todas as horas.

5. Notificação

Por esta altura, o livro está postado mas ninguém sabe dele! Precisamos de fazer alguma coisa quanto a isso. . .

Compomos um e-mail para a lista de correspondência "posted", cc: o produtor, com a linha que vai ficar no GUTINDEX.ALL, a lista matriz dos ficheiros do PG.

A lista "posted" tem apenas alguns subscritores. Estes são as pessoas que indexam e criam as ligações para os textos do PG, e incluem tanto voluntários do PG como administradores de outros sítios que fazem ligações para os textos do PG.

Habitualmente eles também descarregam os textos para obterem mais informações para os seus índices e dizem-nos se algo está mal com os ficheiros.

este e-mail é simplesmente uma notificação oficial para todas estas pessoas e o produtor de que aquele ficheiro foi postado. Aqui fica uma amostra desse e-mail:

To: "Posted Etexts for Project Gutenberg" <posted@listserv.unc.edu>
Subject: [posted] Posted (#5301, Duncan) !
From: "Jim Tinsley" <jtinsley@pobox.com>
Date: Tue, 25 Jun 2002 06:21:27 -0400 (EDT)
Cc: you@example.com
Mar 2004 The Imperialist, by Sara Jeannette Duncan  [SJD#4][mprlsxxx.xxx]5301

Podem existir também algumas advertências se o texto está de alguma forma não padronizado ou se ficheiros que não te texto puro foram postados com ele.

A partir deste e-mail, você pode, se quiser ver algumas das correcções que foram feitas, descarregar imediatamente o ficheiro postado e compará-lo com a sua versão. Uma vez que a notificação é feita depois do ficheiro ter sido copiado para os servidores, ele deve lá estar á sua espera.

Para descobrir como descarregar um livro que acabou de ser postado veja a FAQ "R.3. How can I download a PG text without using the web catalog?" [R.3]

6. Indexar

A partir da lista "posted", a linha de postagem é adicionada ao GUTINDEX.ALL. É então feita, por uma tarefa automática diária, uma entrada de índice em esqueleto na base de dados do sítio, que contém o título, subtítulo, autor, número do texto electrónico, língua e conjunto de caracteres. E os nossos indexadores começam o processo de catalogação, que é mais completo, para o sítio. Isto engloba trabalho como encontrar as datas de nascimento e morte do autor, obter a classificação da Biblioteca do Congresso e outras informações que constituem o índice pesquisável do sítio. este processo implica tempo extra, motivo pelo qual o catálogo pesquisável do sítio deve estar sempre atrasado em relação aos títulos efectivamente postados.

7. Correcções

É notável o modo como pessoas que passaram várias vezes pelo texto até ao ponto de o detestarem, subitamente, vêm nele problemas quando o descarregam alguns dias depois de este estar postado! Há nisto algo de psicológico, penso eu. De qualquer modo, se você descarregar o seu texto e vir problemas nele não se preocupe, envie um e-mail a quem quer que o tenha postado, ou a qualquer outro membro da Equipa de Postagem. Não, você não é estúpido, ou, se o é, está bem acompanhado, porque já todos o fizemos! Não é nada difícil substituir o ficheiro postado por uma cópia corrigida imediatamente.

Com o tempo, outros leitores podem enviar correcções. Se você encontrar um erro num texto do PG, veja a FAQ "I've found some obvious typos in a Project Gutenberg text. How should I report them?" [R.26]

Quando as correcções são pequenas, como a maioria, faremos apenas a mudança no texto existente. Nunca fazemos uma edição nova quando as correcções aparecem logo depois da postagem; actualizamos simplesmente o ficheiro.

V.17. Que tamanho deve ter o texto para se qualificar para o PG?

A maior parte do trabalho do Project Gutenberg centra-se em digitalizar e distribuir itens que têm como origem materiais impressos. Portanto, o tamanho normal de um livro electrónico do PG depende do item ou conjunto de itens nos quais se baseia. Para obras com vários volumes, por exemplo, tendemos a atribuir um único número de livro electrónico a cada volume (uma vez que cada volume foi originalmente impresso como um livro separado). Quando são digitalizados itens pequenos, como contos, panfletos ou periódicos, novamente, tratamos normalmente cada item como um livro electrónico separado (apesar de poderem ser bastante curtos). É aceitável combinar séries de itens curtos relacionados num item mais comprido, o que fica à discrição do produtor do livro electrónico. Isto pode fazer-se com uma série de panfletos ou um conjunto de poemas ou uma colectânea de contos acerca de um tema a partir de um único autor mas de muitas fontes impressas separadas.

Nos casos em que o estatuto dos direitos autorais não pode ser determinado para um conjunto de itens relacionados mas pode sê-lo para um item isolado, podemos redistribuir esse item mais curto como um livro electrónico individual. Esta situação acontece frequentemente com os periódicos nos quais as histórias individuais são protegidas por direitos autorais separadamente e também pode acontecer em algumas monografias.

Ainda que gostássemos de especificar um tamanho "mínimo" para todos os livros electrónicos, a variedade e complexidade dos itens que os voluntários localizam para a nossa colecção tornam difícil ser completamente inflexível. Os itens com pouco texto mas com muitos gráficos (tais como as histórias para crianças), letras de canções (acompanhadas por um MP3 ou por uma partitura) e outros itens oferecem uma significativa variedade ao acervo do Gutenberg, mas podem ter menos texto do que uma obra mais típica com o tamanho de um livro.

Como regra de bolso, a maioria dos livros electrónicos devem ter pelo menos 25K de texto. Esta regra aplica-se à ficção em geral e à não-ficção, obras de referência e séries. Quando uma obra isolada (como um conto) estiver abaixo desta dimensão, procuramos frequentemente combinar itens semelhantes num único ficheiro.

V.18. Que livros são elegíveis?

Um livro é elegível para postagem se pudermos legalmente publicá-lo. É esse o caso se:

  1. estiver no domínio público nos EUA, ou,
  2. o titular dos direitos autorais concedeu direitos ilimitados e não exclusivos de distribuição ao PG.

V.19. As reimpressões ou os fac-símiles são elegíveis?

Uma reimpressão ou um fac-símile de um livro que seria, em si próprio, elegível, é elegível.

Por exemplo, se um livro publicado em 1955 é uma reimpressão de um livro publicado em 1900, então é elegível. No entanto, recai sobre nós o ónus de provar que é uma reimpressão, e se não se disser na FR&V (TP&V) que é uma reimpressão, confirmar a sua elegibilidade pode ser impraticável.

V.20. Qual é a diferença entre uma reimpressão e um fac-símile?

Um fac-símile mantém a aparência da página e as formatações do original. Uma reimpressão mantém as mesmas palavras, mas pode dispor as páginas de modo diferente. Para os nossos fins de direitos autorais, não existe diferença — podemos usar ambos.


V.21. Qual é a diferença entre uma reimpressão e uma "nova edição"?

Uma reimpressão contém apenas as palavras e figuras que foram impressas no original. Uma nova edição está, de algum modo, alterada; tem um texto diferente, ou figuras. Pode ser encurtada ou expandida. Pode ter material adicionado ou modificado, usando outras versões do livro.

Uma nova edição obtém uma nova protecção por direitos autorais, e tem de ser desobstruída com base na sua própria data e estado de direitos autorais, não a data do impressão original do título. Veja também a FAQ "How come my paper book of Shakespeare says it's 'Copyright 1988'?" [C.16] para um exemplo.

Por favor, note que estamos aqui a falar de uma nova edição de um livro impresso, não de um novo número de edição (corrigida) para fins de denominação dos ficheiros do Project Gutenberg.

V.22. Que livro devo trabalhar?

Ninguém no Project Gutenberg lhe vai fazer destacamentos. Você decide que livro processar. Escolha simplesmente um que ainda ninguém tenha feito ou no qual esteja a trabalhar. Também será sensato escolher um de que gostará mdash; irá viver com ele durante algum tempo. Como nota prática, é provavelmente melhor começar por um livro pequeno ou até um conto, uma vez que um livro grande pode demorar bastante tempo a produzir.

Comece por pensar em livros escritos antes de 1923. Escolha um livro de que gosta e verifique-o. Se já foi feito ou ainda está abrangido por direitos autorais, tente outros livros do mesmo autor.

Visite o sítio do Project Gutenberg e descarregue a lista completa de livros do Gutenberg em GUTINDEX.ALL. Dê uma olhadela na Lista de Livros Em Curso e Completos e noutras listas de "pedidos" [B.4]. Procure autores de que gosta, e veja que livros deles ainda não estão disponíveis.

Verifique os seus livros antigos. Talvez tenha uma edição elegível que seria uma grande ajuda para o projecto.

Tente na sua biblioteca. Eles podem ter algumas edições elegíveis — livros que podemos provar que estão no domínio público — e você irá certamente fica com ideias. Pergunte ao seu bibliotecário. Os bibliotecários ficam entusiasmados em ajudar projectos como este.

Inspeccione as lojas de livros em segunda mão da sua área. Existem montes de tesouros para serem apanhados muito barato.

Pesquise na Internet por livrarias e páginas de literatura.

Se tudo isto falhar, pode sempre perguntar no Painel de Voluntários ou experimentar a lista de correspondência gutvol-d [V.12] para ter ideias. Os outros podem saber de que livros as pessoas estão especialmente à procura, ou de projectos já iniciados nos quais você poderia ajudar.

V.23. Tenho um livro em mente, mas não tenho uma cópia elegível.

Primeiro, determine se existem algumas cópias elegíveis do livro, descobrindo a data em que foi publicado, possivelmente a partir do Catálogo da Biblioteca do Congresso [B.5] (Nota PT: ou, em Portugal, a PORBASE em www.porbase.org .) e confirmando as regras de Domínio Público e Direitos Autorais [B.1]. Se existe uma edição em domínio público, o problema seguinte é encontrar uma com que trabalhar.

V.24. Onde posso encontrar um livro elegível?

Os estabelecimentos normalmente mais utilizados são alfarrabistas, vendas de garagem, vendas de bibliotecas, vendas de caridade, e todos os outros locais que vendam livros antigos.

A Internet é um meio extraordinário para encontrar livros usados e antiquários, no qual as livrarias de livros usados de todo o Mundo encontraram formas de cooperar e listar os seus inventários na Rede, de forma a que, quer você viva em Los Angeles, Moscovo ou Perth, possa ainda assim encontrar aquele livro de que está à procura numa loja numa viela de Amsterdão. A maior parte das listas em linha citarão o ano de publicação do livro, por isso pode confirmar se é pré-1923.

Dois desses sítios, que permitem as livrarias de livros em segunda mão listar os seus inventários são:

A página de pesquisa de livros da trussel.com [B.5] tem uma lista de muitas livrarias na Rede deste tipo, ou você pode simplesmente visitar qualquer motor de pesquisa e pesquisar por Livreiros Antiquários ou de Livros Usados ou Alfarrabistas. Pode muitas vezes comprar muito barato livros elegíveis através destes sítios.

Se ainda assim não consegue encontrar o livro de que precisa, poste uma mensagem no Painel de Voluntários ou na lista de correspondência gutvol-d; talvez outra pessoa possa encontrar o livro por si.

Por vezes, pode ser possível trabalhar a partir de uma edição mais tardia, desde que alguém que tenha uma edição elegível possa verificá-la para se certificar que não foram feitas alterações. Por vezes, poderá encontrar uma reimpressão moderna; as reimpressões podem ser elegíveis, desde que digam que são reimpressões de uma edição que seria elegível.

Se você conseguir digitar, ou digitalizar sem danificar o livro, pode pedir emprestados livros o tempo suficiente para os produzir. Mesmo que a sua biblioteca local não tenha os livros que você quer, podem bem ser capazes de os arranjar para si no empréstimo inter-bibliotecas. Pergunte ao seu bibliotecário acerca disso.

V.25. O que é a FR&V?

É uma abreviatura para "Folha de Rosto e Verso" (ou "Title Page and Verso", "TP&V") e significa uma cópia em papel ou em imagem da frente e verso da Folha de Rosto.

Mesmo que o verso esteja em branco, precisamos de ter uma imagem deste para os arquivos, para mostrar que está em branco, para que se, daqui a dez anos, alguém questionar o nosso direito de publicar, possamos provar que não o perdemos simplesmente.

Os editores imprimem informações de direitos autorais, como o título, autor, ano e proprietário dos direitos autorais, e se o livro é uma reimpressão, na FR&V, e ao arquivar isto podemos provar que o livro que produzimos estava no domínio público.

Enviar-nos a FR&V é a Única Verdadeira Forma de obter uma desobstrução de direitos autorais do PG [V.37].

V.26. O que é a "Postagem"?

A postagem é a fase final do processo de produção, na qual é dado ao ficheiro um número e um cabeçalho oficial do PG e este é copiado para os nossos servidores FTP para distribuição. Veja a secção 4 da FAQ "How does a text get produced?" [V.16] para uma explicação muito detalhada.

V.27. Penso que encontrei um livro elegível no qual gostaria de trabalhar. O que faço agora?

Certifique-se que outra pessoa já não está a trabalhar nele e que já não está em linha algures.

V.28. Que livros estão actualmente a ser trabalhados?

Verifique a Lista em Curso de David Price (também conhecida como " InProg List") em linha em <http://www.dprice48.freeserve.co.uk/GutIP.html>. O David obtém a informação a partir das Desobstruções de Direitos Autorais que foram feitas, e organiza-a numa lista. Nunca pode estar 100% actualizada, uma vez que as desobstruções chegam a cada momento, mas é o melhor recurso em linha que temos e é apresentada com muito mais clareza do que os ficheiros de desobstrução originais.

V.29. Como descubro se o meu livro já está em linha algures?

Não há nenhum método a toda à prova; algum estudante pode ter feito, algures, uma digitalização e tê-la colocado na sua página da faculdade sem o anunciar em nenhum outro lado. No entanto, existem algum lugares habituais a confirmar.

Pode parecer óbvio, mas você deve sempre ver em primeiro lugar os arquivos do PG. Descarregue o GUTINDEX.ALL e mantenha-o a jeito. Pesquise a InProg List [B.1].

O local principal para pesquisar pelo seu livro é a On-Line Books Page <http://onlinebooks.library.upenn.edu/>, que se especializa em indexar livros que as pessoas disponibilizam em linha.

Se ainda assim não vê o seu livro em linha algures, vise o seu motor de pesquisa favorito e dê-lhe o título, o último nome do autor e, preferencialmente, algumas palavras pouco comuns da primeira página do livro. Por vezes, uma destas tentativas isoladas aparecem numa pesquisa geral.

V.30. O livro não está na lista Em-Curso e não o consigo encontrar em linha. É seguro ir comprá-lo?

Provavelmente. Pode ter sido desobstruído mas ainda não ter sido incluído na InProg List. Se a quantia em dinheiro para o comprar for uma preocupação, pode enviar um email para qualquer um dos membros da Equipa de Postagem e pedir-lhe que verifique para si a lista das últimas desobstruções. Mesmo isto não é infalível; outro voluntário pode estar a colocar um pedido ao mesmo tempo que você estiver a colocar o seu. Duplicações deste tipo acontecem efectivamente, mas são muito raras.

V.31. O meu livro está em linha, mas não no Project Gutenberg. O que devo fazer?

Se o arquivo em linha for da mesma edição da que você tem (p.ex.: uma tradução não diferente), então pode submeter esse arquivo ao Gutenberg, talvez ligeiramente editado, usando a desobstrução da sua cópia em papel. Veja "I've found an eligible text elsewhere on the Net, but it's not in the PG archives. Can I just submit it to PG?" [V.62] acerca de como fazer isto.

E, naturalmente, você pode sempre fazer ainda a sua própria versão para a PG. É surpreendente como muitas vezes, mesmo edições em papel muito semelhantes, têm pequenas diferenças que podem ser interessantes ou significativas.

V.32. O meu livro já está em linha no Project Gutenberg, mas o meu livro impresso é diferente da versão já arquivada. Posso adicionar a minha versão?

Sim! De facto, supondo que a versão que já está no Project Gutenberg se encontra no domínio público, você poderá encavalitar-se no trabalho já feito, fazendo o que se chama uma "retranscrição comparativa". Por exemplo, digamos que você tem uma edição mais recente do que o arquivo existente; você pode simplesmente pegar no arquivo existente, editá-lo para corresponder à sua versão em papel, e submetê-lo como um ficheiro novo. Claro, você tem de ter Desobstruído os Direitos Autorais [V.37] da sua