Alfabeto (I) ~ átomo

Há três semanas, no post 700, eu mencionei que, na época do BLOGuil, eu criei uma seção chamada Almanaque BLOGuil, que, na forma de perguntas e respostas, trazia curiosidades sobre temas como o alfabeto, os baralhos ou as Olimpíadas. Essa seção, que logo viria a se tornar uma das minhas preferidas, surgiria meio por acaso, quando conversávamos sobre o porquê dos dias da semana terem "nomes próprios" em vários idiomas, mas serem numerados sequencialmente em português. Logo eu comecei a procurar outros assuntos que suscitassem aquelas perguntas que de vez em quando fazemos, mas nem sempre nos animamos a buscar as respostas.

Ao todo, eu fiz oito posts para o Almanaque BLOGuil. Dois deles, o das Olimpíadas e o dos Baralhos, depois foram expandidos e se tornaram séries de posts aqui no átomo. Os outros seis, por tratarem de temas, digamos, mais abstratos, eu tive mais dificuldade para decidir trazer para cá. Tipo, eu já pensei no mínimo umas quatro vezes em transformá-los em posts do átomo (uma delas como parte de uma série chamada "O Melhor do BLOGuil"), mas sempre acabei desistindo.

Entretanto, talvez ter escrito sobre o BLOGuil há duas semanas tenha me animado a desengavetar esse projeto: essa semana, enquanto definia qual seria o post de número 703, decidi arriscar e transformar mais um post do Almanaque BLOGuil em post do átomo. Evidentemente, esse post não será uma reprodução daquele do BLOGuil, contendo novas informações, e sendo estruturado como texto corrido, e não como perguntas e respostas. Eu planejo fazer o mesmo com os outros temas restantes do Almanaque BLOGuil, embora não saiba nem possa prometer quando; já que alguns desses temas não encaixam em nenhuma das Categorias existentes, eles ficarão agrupados na nova Categoria "Almanaque", que eu estou inaugurando hoje. Portanto, puxem uma cadeira, peguem seus lápis e preparem-se: hoje é dia de alfabeto no átomo.

A importância da escrita para a civilização é imensurável, já que, sem um sistema de escrita, seria bem mais difícil difundir conhecimento - de fato, para muitos, o que diferencia um povo civilizado de um povo bárbaro é justamente a linguagem escrita, tanto que a própria História da humanidade só começa a ser considerada como tal a partir do surgimento da escrita, sendo tudo o que veio antes considerado Pré-História. O alfabeto é, talvez, a mais importante peça de um sistema de escrita, justamente por ser o método mais prático: são poucas letras, fáceis de se decorar e que, combinadas, podem formar todas as palavras de um determinado idioma. Se ninguém jamais tivesse inventado um alfabeto, provavelmente hoje estaríamos todos desenhando ao invés de escrevendo para registrar nossa linguagem.

O primeiro povo a desenvolver a linguagem escrita, os egípcios, inclusive, fizeram justamente isso, criando um conjunto de símbolos hoje conhecidos como hieróglifos, derivados das antigas pinturas rupestres com as quais os homens pré-históricos registravam cenas de seu cotidiano. Os hieróglifos eram um conjunto de 24 desenhos ricamente trabalhados, como um falcão, um rio ou uma cobra, cada um relacionado a um som presente no idioma do Antigo Egito. Estima-se que os hieróglifos tenham sido criados por volta do ano 3300 a.C., e seu principal uso era para registrar textos sagrados, como os encontrados nas paredes internas dos templos, sendo daí que veio seu nome: em grego, hierós significa "sagrado", e glyphein significa "escrita". Uma dificuldade no uso dos hieróglifos é que nem todos os sons possíveis do idioma egípcio antigo eram representados - exceto por um que representa uma vogal inicial ou final, cada um deles representa um som consonantal, devendo a vogal que vem depois dessa consoante (e até mesmo a vogal inicial ou final, no caso do outro símbolo), ser deduzida por quem lê a palavra. É mais ou menos como se alguém escrevesse SCO, e quem estivesse lendo tivesse de deduzir se a palavra era "saco", "seco", "soco" ou "suco" de acordo com o contexto.

No século XV a.C. - mais de quinze séculos após a criação dos hieróglifos, portanto - surgiria no Deserto do Sinai o primeiro conjunto de símbolos que poderia ser considerado efetivamente um alfabeto. Chamado de protossinaítico, palavras usando seus 22 símbolos seriam encontradas nas paredes de minas egípcias da Península do Sinai, e teriam sido escritas por um povo de origem semita que vivia na região, foi escravizado pelos egípcios e forçado a trabalhar nessas minas. Recentes estudos descobriram que esse alfabeto era a evolução de um conjunto de símbolos ainda mais antigo, criado por volta do século XVIII a.C., e inspirado em um conjunto de hieróglifos usado na região desde o século XX a.C. (é sempre bom lembrar que, para tempo a.C., a contagem é de trás para frente, então o século XX veio antes do XV).

É interessante registrar que o protossinaítico tem seu status de "primeiro alfabeto" contestado por dois grupos de pesquisadores, o primeiro por uma questão técnica: desde que os sistemas de escrita começaram a ser estudados e classificados, ainda no século XVIII, ficou estabelecido que, para que um sistema de escrita seja considerado um alfabeto, suas letras devem representar as consoantes e as vogais da língua com igual valor (ou seja, uma letra para cada consoante e uma letra para cada vogal). O primeiro grupo, portanto, alega que o protossinaítico não possui símbolos para representar as vogais, e que aqueles que identificam alguns de seus símbolos como vogais estariam equivocados. O segundo grupo alega que, mesmo que o protossinaítico seja um alfabeto, não foi o primeiro: segundo eles, um outro conjunto de 30 símbolos, incluindo três que representavam vogais, já eram usados na cidade de Ugarit, na Síria, desde antes do século XV - embora, como Ugarit foi destruída por volta de 1180 a.C., é difícil precisar quando de fato esses símbolos teriam sido inventados.

Seja como for, um dia o povo semita do Deserto do Sinai deixaria de ser escravo do Egito, e, no século XII a.C., fundaria, entre o que é hoje o norte da Síria e o centro-sul da Turquia, um reino que ficaria conhecido como Neo-Hitita (o Império Hitita original, que ocupava o que hoje é a Síria, havia caído alguns anos antes, então esse era o novo). O protossinaítico, com algumas modificações, se tornaria o conjunto de símbolos oficial para a escrita dos neo-hititas, e logo se popularizaria também dentre seus vizinhos, os cananeus e os fenícios.

Os fenícios eram um povo mercante, especializado em negociar com outros povos, e, portanto, gostava de fazer tudo da forma mais prática possível, para não perder tempo e, consequentemente, dinheiro. Assim, eles adaptaram os símbolos protossinaíticos para as formas mais simples possíveis - em uma simplificação exagerada, era como se os hieróglifos fossem desenhos trabalhados, os símbolos protossinaíticos fossem desenhos simples, e os símbolos fenícios fossem um bando de rabiscos. Ao todo, os fenícios criaram 24 "rabiscos", que, justamente devido à sua facilidade de escrita, logo se tornariam populares também dentre seus vizinhos, substituindo os conjuntos de símbolos que eles usavam. Criado no século X a.C., o alfabeto fenício foi o primeiro a ter um símbolo diferente para cada consoante e para cada vogal presentes no idioma fenício, sendo, portanto, o primeiro alfabeto "verdadeiro" - embora isso também seja contestado por um grupo de pesquisadores, que alega que suas vogais não representam sons de vogais, mas melhor deixar isso pra lá.

Os fenícios também eram um povo que viajava muito, principalmente para negociar. Viajando, eles levaram seu alfabeto para todo lado, e isso acabou estimulando o surgimento de vários outros: basicamente, cada povo que negociava com os fenícios já tinha um sistema de escrita qualquer, mas, ao ver que o dos fenícios era mais simples, acabava adotando-o também, primeiro em suas negociações com os fenícios, depois em seu dia a dia. Como cada língua tinha suas particularidades, os símbolos fenícios acabavam modificados ou ganhavam adições, dando origem a novos alfabetos. Foi assim, por exemplo, que surgiram os conjuntos de símbolos cananeu e aramaico, que, mais tarde, dariam origem ao usado no idioma hebraico, e o nabateu, que daria origem ao usado no árabe.

Quando os fenícios chegaram á Grécia, esse esquema se repetiu: na época, os gregos usavam um conjunto de símbolos conhecido hoje como Linear B, que descendia de um conjunto anterior chamado Linear A, que, por sua vez, era baseado nos hieróglifos egípcios. O Linear A possui pouquíssimos exemplares sobreviventes, então jamais foi decifrado e ninguém sabe ao certo quantos símbolos ele tem, mas o Linear B possuía nada menos que 87 símbolos que representavam cada um uma sílaba presente no idioma micênico, o usado na Grécia na época de sua criação, e mais de 100 símbolos que representavam cada um uma palavra inteira, usados em conjunto com os outros 87. Evidentemente, para quem escrevia, era mais fácil aprender 24 símbolos do que duzentos, então os gregos rapidamente adotaram os símbolos fenícios, mais uma vez fazendo as modificações necessárias.

Foi graças aos gregos, também, que o alfabeto ganharia seu nome: no alfabeto fenício, cada letra possuía o nome de um animal, planta ou objeto cujo nome começasse com aquela letra, e cuja forma lembrasse a do nome em questão. Assim, a primeira letra do alfabeto fenício, que se parecia com a cabeça de um touro, se chamava aleph, que significava "boi" em fenício, e a segunda, que se parecia com o telhadinho de uma casa, se chamava bet, que significava "casa". Esses nomes acabariam mantidos no hebraico, mas, no grego, foram corrompidos para alpha e beta. E, juntando os nomes das duas primeiras letras, chegou-se ao nome alfabeto.

Antes mesmo de Roma conquistar a Grécia, os gregos já possuíam transações mercantis com os povos da península itálica, e, assim, o alfabeto grego chegaria até a Itália, onde acabaria mais uma vez adaptado, de acordo com os gostos e necessidades de cada povo local, dando origem a diversos novos alfabetos. Um desses alfabetos seria criado pelos etruscos, povo que vivia na região da Itália hoje correspondente à Toscana, à Úmbria e ao Lácio. Os etruscos possuíam um idioma próprio, também chamado etrusco, e, por volta do século VIII a.C., adaptaram as letras do alfabeto grego a seus sons, criando o alfabeto etrusco, que tinha 27 letras, três a mais que o grego.

Por volta do século VII a.C., surgiria, na região do Lácio, um novo idioma, que se tornaria conhecido como latim, e as letras foram novamente adaptadas, dando origem ao alfabeto latino (pois, originalmente, "latino" era o nome dado a quem nascia no Lácio; vale citar também que é por isso que o idioma português é conhecido como "a última flor do Lácio", já que teria sido o último dos idiomas derivados do latim a surgir), que usava 21 das 27 letras etruscas, algumas com formatos modificados. Quando o Império Romano decidiu adotar o latim como sua língua oficial, trouxe junto o alfabeto latino, que ganharia a adição de duas novas letras, presentes no alfabeto grego mas não no latino original, para um total de 23. As três restantes seriam adicionadas ao longo dos anos, emprestadas de alfabetos usados por povos conquistados pelos romanos, até chegarmos às 26 que usamos hoje.

A Grécia não seria, porém, o único local onde o alfabeto fenício seria adaptado e daria origem a um novo. Por volta do século I d.C. surgiria, no norte da Europa, um alfabeto derivado do fenício conhecido como futharco, cujo nome vinha não de um povo, mas de suas seis primeiras letras (F, U, Þ, A, R e K). As letras desse alfabeto eram conhecidas como runas, do norueguês rún, que significava, bem, "letra". Por causa disso, ao longo dos séculos I e II d.C., o futharco daria origem a diversos alfabetos hoje conhecidos coletivamente como alfabetos rúnicos, já que suas palavras usavam as runas, e não as letras dos alfabetos grego ou latino. Alfabetos rúnicos, cada um com pequenas variações de um para outro, eram usados na Noruega, Suécia, Dinamarca, Alemanha, Grã-Bretanha e Irlanda. Conforme os romanos conquistavam essas regiões, entretanto, eles impunham o alfabeto latino como a única forma oficial de se escrever por lá, o que acabaria levando à extinção dos alfabetos rúnicos, hoje encontrados apenas em inscrições antigas. Algo semelhante aconteceria na Hungria, onde, desde o século V a.C., era usado um alfabeto derivado do fenício, hoje conhecido como alfabeto húngaro antigo; por influência do Império Romano, esse alfabeto foi gradativamente abandonado em prol do latino, mesmo sendo mais difícil representar os sons próprios do idioma húngaro usando o alfabeto dos romanos. Hoje, o alfabeto húngaro antigo ainda é usado em textos religiosos e no dia a dia em algumas regiões do país, mas não é considerado um alfabeto oficial do idioma húngaro.

A influência do Império Romano sobre a Europa, aliás, foi tão grande que praticamente todos os povos europeus passaram a usar o alfabeto latino, não importando o quanto os sons de seus idiomas fossem complicados de se representar com suas letras. Para tentar contornar essa situação, alguns idiomas usaram combinações de letras (não existem os sons LH e NH em latim, então, para representá-los, usamos duas letras ao invés de uma), sendo que essas combinações não são as mesmas para todos os idiomas (em italiano, por exemplo, o som NH é representado por GN); em conjunto com as combinações de letras, alguns alfabetos também usam sinais gráficos, como os acentos, a cedilha e o til, que mudam o som original das letras (em espanhol, por exemplo, o som NH é representado por Ñ). Há ainda alguns idiomas que optaram pelo caminho mais difícil, e acrescentaram letras novas ao alfabeto latino: hoje, estão em vigor a letra ß, usada no alemão, erroneamente chamada de "beta", cujo nome verdadeiro é ess-zet, e que tem som de SZ; o eth (ð) e o thorn (þ), letras "emprestadas" do futharco usadas hoje no islandês, e que fariam bastante sentido se usadas no inglês, já que a primeira tem o som do TH de thing e a segunda o do TH de that; e o schwa (ə), usado no azeri, o idioma do Azerbaijão, para o som de "é" (com o "e" tendo som de "ê"). Vale citar ainda que alguns idiomas, como o francês, costumam "grudar" duas letras em algumas palavras, como em œuf ("ovo"), isso se chama ligatura, e não constitui uma letra nova, apenas o ato de se escrever duas letras juntas - como curiosidade, o famoso & também é uma ligatura, das letras E e T, e surgiu porque a conjunção aditiva "e", em francês, se escreve et.

Por volta do ano 862 d.C., dois irmãos e monges bizantinos nascidos na cidade de Salônica, Grécia, seriam enviados pelo Imperador de Bizâncio, Miguel III, para catequizar a região da Morávia, que hoje corresponde a partes da República Tcheca, Eslováquia e Hungria. Esses monges, hoje conhecidos como São Cirilo e São Metódio, decidiriam traduzir os livros religiosos que usariam em sua liturgia, originalmente escritos em grego e latim, para o idioma eslavônico, usado na Morávia na época, para que a população compreendesse seu sentido e fosse mais facilmente convertida. Eles se depararam, porém, com um problema: o idioma eslavônico possuía sons que não estavam presentes nem no grego nem no latim, e representá-los com o alfabeto grego ou latino de forma que os monges eslavos (que depois iriam ler esses textos) compreendessem o que estava escrito se mostrou inesperadamente difícil. São Cirilo, então, decidiu criar um novo alfabeto de 42 letras especialmente para representar os sons próprios do eslavônico, originalmente conhecido apenas como alfabeto eslavônico, mas que, a partir do século XIV d.C., passou a ser chamado de glagolítico - palavra derivada do verbo glagolati, que, em eslavônico, significava "falar".

O alfabeto glagolítico, entretanto, não era usado pela população em geral, e sim apenas pelos monges, e na maior parte das vezes apenas em textos religiosos. No final do século VIII d.C., um monge discípulo de São Cirilo, hoje ele mesmo um santo, São Clemente de Ocrida, que vivia em um monastério na Bulgária, decidiria criar uma nova versão do alfabeto glagolítico, que seria usado junto ao grego ou ao latino quando os monges de sua ordem fossem ensinar outras pessoas a ler e a escrever. São Clemente de Ocrida achava os desenhos das letras do alfabeto glagolítico muito trabalhados em comparação com os gregos e latinos, e temia que muitos se desanimassem a aprendê-las, por isso, ele "copiaria" muitas das letras do alfabeto grego, inventando letras novas para os sons que existissem no idioma búlgaro mas não no grego. Por coincidência, esse novo alfabeto também acabaria com 42 letras. Ao invés de chamá-lo de alfabeto búlgaro, São Clemente de Ocrida decidiria homenagear seu mentor, já falecido na época em que o novo alfabeto foi criado, e chamá-lo de cirílico, palavra derivada do nome Cirilo.

O nome do alfabeto, aliás, hoje é tema de muita discussão entre acadêmicos do leste europeu. A maioria dos alfabetos ainda usados hoje tem o mesmo nome do idioma o qual ele foi criado para representar, como, por exemplo, "alfabeto grego" ou "alfabeto latino"; com o cirílico, isso não ocorre, já que não há um "idioma cirílico". Como o russo é hoje o idioma mais conhecido que utiliza o alfabeto cirílico, a maioria das pessoas, imitando o padrão, acaba chamando-o de "alfabeto russo", o que, como vocês devem imaginar, irrita os linguistas búlgaros, já que não foi na Rússia nem para o idioma russo que o alfabeto nasceu, e sim na Bulgária para o idioma búlgaro. Diversos acadêmicos búlgaros defendem uma mudança oficial no nome do alfabeto para "alfabeto búlgaro", enquanto acadêmicos da Rússia e Sérvia propõem um meio-termo, segundo o qual o alfabeto seria conhecido como azbuka - palavra que, assim como "alfabeto", é a junção dos nomes das duas primeiras letras do alfabeto cirílico original, az e buk. Enquanto não se chega a uma conclusão, o alfabeto continua oficialmente sendo chamado de cirílico, e popularmente conhecido como russo, apesar dos protestos dos búlgaros.

O alfabeto cirílico usado hoje não é o mesmo criado por São Clemente de Ocrida, que atualmente é conhecido como "alfabeto cirílico arcaico". Ao longo dos anos, ele foi sofrendo modificações para se adequar aos diferentes idiomas dos países onde era adotado, perdendo algumas letras e ganhando algumas novas. A mais conhecida versão do alfabeto cirílico hoje, como já foi dito, é a usada para representar o idioma russo, que possui 33 letras; a versão usada atualmente na Bulgária tem 30 letras, todas presentes na versão russa, mas a versão usada na Sérvia, por exemplo, apesar de também ter 30 letras, possui seis que não estão presentes na versão russa ou na búlgara, e aquela usada na Ucrânia, apesar de ter 33 letras como a russa, tem quatro diferentes. Ao todo, estima-se que existam mais de 30 versões do alfabeto cirílico, totalizando umas 60 letras diferentes, sendo que algumas delas são usadas apenas por pequenos grupos étnicos - como o "alfabeto dungan", versão do alfabeto cirílico usada por um grupo étnico composto por cerca de cem mil pessoas na Ásia Central.

Outro alfabeto que merece destaque é o hangul, usado para escrever no idioma coreano, devido à forma curiosa como suas letras se comportam. Muitos pensam que, no idioma coreano, cada letra representa uma palavra ou uma sílaba; na verdade, seu alfabeto é composto de 40 letras, sendo 19 consoantes e 21 vogais. O que ocorre é que essas letras não são escritas de forma uma seguida da outra, como nos demais alfabetos, e sim agrupadas em blocos, com, aí sim, cada bloco representando uma das sílabas da palavra - assim, o nome hangul, por exemplo, é composto por dois blocos, um formado pela união das letras H-A-N, e o outro formado pela união das letras G-U-L. Cada bloco pode ser composto por até 6 letras, desde que tenha pelo menos uma consoante e uma vogal. Os blocos seguem regras de construção próprias, que determinam quando uma letra é escrita sobre a outra e quando ela deve ser escrita à direita - no bloco H-A-N, por exemplo, o A vem à direita do H, mas o N vem sob as outras duas; já no bloco G-U-L, cada letra vem abaixo da anterior. O alfabeto hangul foi criado em 1443, com o nome de hunminjeongeum ("os sons corretos para a instrução do povo", em coreano) pelo Rei Sejong, o Grande, para substituir os hanja, ideogramas importados da China; apesar disso, os hanja ainda foram usados na Coreia do Sul juntamente com o hangul até 1990, e ainda podem ser encontrados em alguns textos oficiais do governo e religiosos, e na Coreia do Norte até 1964, quando foram banidos por lei, e todos os textos que existiam com hanja foram convertidos para o novo alfabeto (e supostamente destruídos). O nome hangul significa "escrita elevada", e foi criado em 1912 por Ju Si-gyeong, considerado o pai da moderna linguística coreana; o nome hangul, entretanto, não é usado na Coreia do Norte, onde o alfabeto se chama Chosongul ("escrita de Choson", sendo Choson o nome usado na Coreia do Norte para seu próprio país; na Coreia do Sul, o nome usado para o país é Daehan).

Ninguém sabe ao certo quantos alfabetos diferentes ainda estão em uso hoje, pois alguns deles são usados apenas por grupos étnicos específicos ou em comunidades pequenas, embora as atuais estimativas sejam de que o número total é baixo, estando entre 12 e 15. Sem sombra de dúvida, o mais usado é o latino (usado por cerca de um bilhão de pessoas para escrever em praticamente todos os idiomas do hemisfério ocidental e mais alguns da Ásia e Oceania), seguido do cirílico (usado predominantemente nos idiomas do Leste Europeu, mas também em alguns da Ásia, por cerca de 250 milhões de pessoas) e do hangul (usado por cerca de 63 milhões de pessoas nas duas Coreias). Apesar de sua importância histórica e acadêmica, o alfabeto grego vem apenas em quinto nessa lista (já que é usado no dia a dia apenas por cerca de 13 milhões de pessoas na Grécia e no Chipre), atrás do tifinagh (usado em um idioma do norte da África chamado tamazight, falado em uma área que abrange partes do Marrocos, Egito, Argélia, Líbia, Mali, Níger, Tunísia, Burkina Faso e Mauritânia, por um grupo de cerca de 30 milhões de pessoas), mas à frente do armênio (usado por cerca de 6 milhões de pessoas na Armênia e Azerbaijão), do santali (usado em um idioma de mesmo nome falado em partes da Índia, Bangladesh, Nepal e Butão, por cerca de 5 milhões de pessoas) e do geórgico (do georgiano, idioma da ex-república soviética da Geórgia, usado por cerca de 4 milhões de pessoas), sendo esses os únicos usados por grupos maiores que um milhão de pessoas.

Alguns devem ter dado falta do hebraico e do árabe; a razão pela qual eles não estão na lista dos alfabetos mais usados no mundo é simples: eles não são alfabetos, e sim abjads. Assim como um alfabeto, um abjad é um conjunto de símbolos que representam os sons de uma determinada língua, sendo a única diferença entre um e outro o fato de que, em um abjad, apenas as consoantes são representadas por letras, sendo as vogais representadas por pequenos sinais, chamados diacríticos, colocados próximos às consoantes, ou devendo ser deduzidas por quem está lendo de acordo com o contexto. Por causa disso, os abjads também são conhecidos como "alfabetos consonantais", que era seu nome oficial até 1990, quando o linguista norte-americano Peter T. Daniels cunhou o termo "abjad", falando em sequência as quatro primeiras letras do abjad árabe.

Em número de usuários, atualmente o abjad mais usado é do idioma árabe, que possui algumas letras para representar vogais, sendo, por isso, considerado por alguns linguistas como um "abjad impuro", e chamado por eles de "alfabeto árabe", nome que eu também prefiro. O alfabeto árabe é uma evolução do abjad nabateu, usado para escrever um dialeto do aramaico, e surgiu no século IV, na Jordânia. No início, ele não era muito popular, sendo usado por apenas alguns pequenos grupos étnicos da Jordânia e da Síria, mas, a partir do século VII, graças à expansão do islamismo, que o usava como alfabeto oficial - já que foi com esse alfabeto que o Corão, o livro sagrado do islamismo, foi escrito - ele se popularizaria em todo o mundo árabe.

O alfabeto árabe possui 28 letras, sendo três usadas para representar as vogais A, I e U (E e O devem ser deduzidos de acordo com o contexto); a rigor, entretanto, só existem 18 letras diferentes, já que muitas possuem a mesma forma, sendo diferenciadas apenas pelos sinais diacríticos (por exemplo, os sons B, T e TH usam a mesma letra, mas no B ela tem um pontinho embaixo, no T tem dois pontinhos em cima, e no TH tem três pontinhos em cima). Diacríticos também são usados para mudar o som das vogais (de á para â, por exemplo) e para escrever palavras estrangeiras (que tenham sons que não estão presentes no árabe). Uma curiosidade sobre o alfabeto árabe é que cada letra pode ter até quatro formas diferentes, dependendo de se ela vem no começo, no meio ou no fim da palavra, ou se está escrita isoladamente. Na Arábia Saudita, Iraque, Egito, Argélia, Tunísia e Marrocos, o alfabeto possui quatro ou cinco letras extras por país, usadas para representar sons que não existem no chamado "árabe moderno padrão", a versão hoje considerada oficial do idioma árabe - sendo que o árabe efetivamente usado em cada país possui pequenas diferenças de pronúncia e vocabulário, como ocorre, por exemplo, com o espanhol na América Latina.

Assim como o cirílico, o alfabeto árabe possui variações, sendo que a "versão oficial" é a usada para escrever em árabe por cerca de 220 milhões de pessoas no Oriente Médio e Norte da África. As três mais usadas além da oficial são o alfabeto urdu, usado para o idioma de mesmo nome por cerca de 160 milhões de pessoas no Paquistão (onde é o idioma oficial) e no norte da Índia, com 34 letras (as 28 do árabe mais 6 novas); o alfabeto persa, usado por cerca de 130 milhões de pessoas no Irã, no Tajiquistão e em partes do Iraque, Rússia, China, Afeganistão, Uzbequistão e Azerbaijão, para idiomas como farsi, dari, tajique e uyghur, e que possui 32 letras; e o alfabeto pashto, usado para o idioma de mesmo nome por cerca de 50 milhões de pessoas no Afeganistão (onde é o idioma oficial) e Paquistão, com 30 letras.

O segundo abjad em número de usuários é o hebraico, que surgiu no século III d.C. a partir de uma adaptação do aramaico. Diferentemente do que ocorre com o árabe, o hebraico não tem nenhuma vogal, apenas 22 consoantes; quatro dessas consoantes, porém, podem ser usadas para representar vogais caso estejam isoladas ("sozinhas"), como por exemplo a primeira letra, chamada aleph, que normalmente tem o som de uma parada glotal (algo como o espaço que a gente dá entre cada "oh" quando fala "oh-oh"), mas sozinha pode ser usada para representar a letra A. Cinco das 22 letras possuem duas formas diferentes (para um total de 27 letras), sendo a segunda forma sempre e somente usada quando essa letra vem no final de uma palavra. As vogais são indicadas por pontos e traços, conhecidos como niqqudot (que é uma palavra no plural, o singular é niqqud) colocados sob a letra que vem imediatamente antes da vogal, com um niqqud diferente para cada som vocálico e mais alguns usados para mudanças de som, sendo que esses vêm acima da letra (para mudar o som de S para SH, por exemplo) ou no espaço vazio em seu centro (por exemplo, para mudar o som de V para B). Curiosamente, no idioma hebraico, exceto no caso de livros infantis, textos religiosos, poemas, palavras estrangeiras e palavras que podem ter duas pronúncias diferentes, os niqqudot que representam as vogais nunca são escritos, devendo as vogais serem deduzidas por quem está lendo.

Diferentemente do que ocorre com os alfabetos, o número de abjads ainda em uso hoje é conhecido, e são apenas cinco: além do árabe e do hebraico, temos o siríaco, usado para escrever o idioma de um grupo étnico que hoje ocupa partes do Irã, Iraque, Síria e Turquia; o thaana, usado para escrever o dhivehi, um dos idiomas das ilhas Maldivas; e o samaritano, usado para escrever em hebraico por um pequeno grupo de cerca de 700 samaritanos que ainda existe em Israel e na Palestina. No passado, havia muitos outros abjads, como o aramaico, o mandaico e o púnico, mas, quando seus idiomas desapareceram, eles deixaram de ser usados, e hoje só existem em documentos preservados. Vale citar também que, em todos os cinco abjads ainda existentes hoje, as palavras são escritas da direita para a esquerda, e não da esquerda para a direita.

Como vocês devem saber, nem todos os idiomas do mundo usam alfabetos ou abjads. Idiomas como o japonês, por exemplo, usam silabários, que, como o nome sugere, possuem símbolos que representam não uma letra, e sim uma sílaba inteira, ou seja, enquanto alfabetos e abjads são conjuntos de letras, silabários são conjuntos de sílabas. Como esses conjuntos são específicos para cada idioma, caso esse idioma não possua o som de uma determinada consoante, essas sílabas não serão representadas - em japonês, por exemplo, não existe o som de L, então seus silabários não possuem símbolos para LA, LE, LI, LO nem LU. A rigor, os símbolos de um silabário são sempre no formato consoante + vogal (nunca vogal + consoante), mas podem ocorrer exceções - em japonês, por exemplo, existe um símbolo para cada vogal em separado e um que representa apenas a letra N, usado, para escrever, por exemplo, sentai, que, em japonês, é uma palavra de quatro sílabas (SE-N-TA-I).

O japonês, inclusive, possui não apenas um silabário, mas dois, chamados hiragana ("letras suaves") e katakana ("letras fragmentadas"), nomes que vêm do fato de que os símbolos do hiragana são arredondados, enquanto os do katakana têm ângulos retos e linhas fortes. Ambos possuem 46 símbolos cada (com alguns símbolos de um sendo bem diferentes dos do outro), sendo cinco para vogais, 40 para combinações de consoante + vogal, e um para o som do N isolado. As 40 combinações são as mesmas tanto para o katakana quanto para o hiragana, ou seja, mesmo usando o katakana, são necessárias adaptações para se escrever palavras estrangeiras, como trocar o L pelo R, o V pelo U, e colocar um U após cada consoante "muda" (planes, por exemplo, seria escrito "puranesu"). O hiragana surgiu no século V d.C., adaptado dos ideogramas chineses, e é o mais usado no dia a dia; já o katakana surgiu no século IX d.C., foi originalmente criado por monges budistas para escrever textos sagrados, mas hoje costuma ser usado principalmente para escrever palavras estrangeiras, sendo usado também para termos técnicos, nomes próprios e para enfatizar uma palavra em meio ao texto.

O hiragana e o katakana são indubitavelmente os silabários mais usados no mundo, mas isso nem é uma vantagem muito grande, já que, além deles, só existem três outros ainda em uso: o cherokee, inventado entre 1809 e 1824 no Canadá pelo Chefe Sequóia dos Cherokee, para ser usado para registrar de forma escrita a língua desse povo indígena; o eskayan, usado em apenas uma das ilhas das Filipinas, e apenas por um único grupo étnico, de cerca de 550 pessoas; e o yi, usado por um grupo de cerca de 2 milhões de pessoas no sul da China.

Até bem pouco tempo atrás o número de silabários era bem maior, não porque muitos deles tenham sumido de repente, mas porque, recentemente, a maioria deles passou a ser conhecida por outro nome: abugidas. Embora o nome abugida tenha sido inventado em 1990, também por Peter T. Daniels e junto com abjad, ele demorou para ser amplamente aceito na comunidade linguista, e somente por volta de 2010 que livros e trabalhos científicos passaram a se referir amplamente a abugidas como tal. Assim como um silabário, uma abugida é um conjunto de símbolos no qual cada um deles representa uma sílaba inteira; a diferença está no fato de que, enquanto em um silabário os símbolos que usam a mesma consoante são completamente diferentes entre si (o símbolo do BA não tem nada a ver com o do BE, por exemplo), em uma abugida eles possuem um elemento em comum, que ganha um acréscimo diferente de acordo com a vogal que o segue. Para que isso ocorra, a abugida tem um símbolo para cada consoante, e um apêndice próprio que deve ser anexado a esse símbolo para cada som possível dessa consoante produzir.

Para melhor entender, vamos pegar como exemplo o devanagari, abugida usada para escrever várias línguas da Índia e do Nepal, incluindo o hindi. O devanagari é composto por 48 letras, 11 representando vogais e 37 representando consoantes. Cada consoante tem um valor intrínseco de "+A", então, se você deseja escrever, por exemplo, PA, basta escrever P, para TA, basta escrever T, e assim por diante. Caso você queira escrever outra combinação, como, por exemplo PE, deve pegar a letra que corresponde ao P e colocar um apêndice próprio nela - e esse mesmo apêndice será colocado junto ao T se você quiser escrever TE. Isso é diferente do que ocorre no hangul, já que o apêndice que representa o som E não é a letra E - ou seja, as letras não se combinam, elas apenas "aumentam" conforme o som muda. Essa característica também faz com que, diferentemente de um silabário, nem sempre os símbolos de uma abugida correspondem a um encontro consoante + vogal - no devanagari, por exemplo, existem símbolos para encontros como PRA, TLE, GAU etc.

O devanagari é a principal abugida em uso atualmente. Pertencendo a uma família de métodos de escrita conhecida como brâmane e criado por monges no século I d.C., ele descende da abugida gupta, hoje em desuso, usada originalmente para escrever em sânscrito, uma antiga língua da Índia hoje encontrada apenas em textos religiosos - e, na maior parte das vezes, escrita usando o próprio devanagari. Uma característica curiosa do devanagari é uma linha horizontal que acompanha toda a escrita, com as letras parecendo estarem "penduradas" nessa linha.

Cada país do sudeste asiático continental, exceto o Vietnã (que usa o alfabeto latino, introduzido lá pelos Jesuítas que foram catequizar o povo local), também tem sua própria abugida; dessa forma, por lá encontramos o tailandês (Tailândia), o khmer (Camboja), o lao (Laos) e o birmanês (Myanmar) - sendo que, deste último, pode-se citar como curiosidade que todas as letras são arredondadas, pois o meio preferencial de se registrar a escrita era em folhas de palmeira, que se rompiam caso as letras tivessem ângulos. Também merecem menção o sinhala, do Sri Lanka, e o tibetano, banido na China mas oficial no Butão. Fora da Ásia, a abugida de maior destaque é o ge'ez, contemporâneo do cananeu e do nabateu, o que faz com que ele seja um dos mais antigos sistemas de escrita ainda usados; com 27 letras e oito apêndices diferentes para se determinar os sons vocálicos, o ge'ez é usado para escrever em amárico, o idioma oficial da Etiópia - o nome "abugida", aliás, vem da junção dos nomes das quatro primeiras letras do ge'ez.

Assim como ocorre com os alfabetos, ninguém sabe ao certo quantas abugidas ainda estão em uso, já que algumas delas são usadas apenas por grupos étnicos pequenos, mas estima-se que o número de abugidas é bem maior que o de alfabetos, sendo por volta de 50; só na Índia, por exemplo, ainda são usadas 17 abugidas, chamadas devanagari, assamese, bantawa, bengali, chakma, gujarati, gurmukhi, kannada, jenticha, lepcha, malayalam, manipuri, odia, sorang sompeng, tâmil, telugu e varang kshiti - e, se você acha muito, saiba que a Índia possui 23 idiomas oficiais (incluindo o inglês, o hindi e o urdu) e mais 27 dialetos.

Finalmente, temos os ideogramas. Diferentemente de uma letra ou sílaba, cada símbolo de um conjunto de ideogramas representa uma ideia completa, motivo pelo qual eles receberam esse nome. O mais comum é que cada símbolo represente uma palavra, mas pode ocorrer de um mesmo símbolo representar duas palavras juntas, ou até mesmo de uma palavra ser representada por vários símbolos diferentes, caso ela possua diversos significados. Evidentemente, isso faz com que seja necessária uma gigantesca quantidade de símbolos diferentes, sendo essa a maior desvantagem dos ideogramas em comparação com outros sistemas de escrita; em chinês, por exemplo, estima-se que já existam mais de 80.000 símbolos diferentes, e já é tido como impossível que uma pessoa decore todos eles - calcula-se que a maioria dos chineses com educação superior saiba apenas por volta de 4.000 ideogramas.

O conjunto de ideogramas chineses - também conhecidos como zhongwen, palavra que significa "chinês" em mandarim, o idioma oficial da China - possuem duas curiosidades interessantes. Em primeiro lugar, muitos deles são considerados extremamente complexos e difíceis de se desenhar - alguns chegam a ter por volta de 30 traços, enquanto a nossa letra A, por exemplo, tem só três - o que levaria à criação, na década de 1950, pelo governo de Mao Tse-Tung, de um novo conjunto de símbolos conhecido como "chinês simplificado" (sendo o conjunto principal o "chinês tradicional"). Esses símbolos representam as palavras mais comuns do idioma mandarim, e foram criados para facilitar a escrita e a memorização - o símbolo do verbo "permitir", por exemplo, deixou de ter 25 traços e passou a ter apenas cinco. Segundo o governo chinês, o chinês simplificado foi um grande sucesso, mas estudos realizados por observadores internacionais apontam que não houve melhora no letramento ou aumento no número de símbolos conhecidos pelo chinês médio, e, pelo contrário, muitos textos em chinês simplificado acabam vindo com os símbolos do chinês tradicional ao lado, em uma demonstração de que os símbolos antigos ainda são mais conhecidos. O chinês simplificado só é usado e ensinado hoje na China continental, com Hong Kong, Macau e Taiwan usando apenas o chinês tradicional.

A segunda curiosidade é que a China possui um total de dez dialetos, mas seis deles usam os mesmos símbolos que o mandarim, apenas correspondendo a sons diferentes, o que faz com que quem fale mandarim, jin, huizhou, gan, xiang, hakka ou pinghua consiga ler o mesmo texto sem problemas, mas, se ler em voz alta, quem fala outro dialeto diferente do seu não vai entender nada ("guerra", por exemplo, em mandarim é "uwo", enquanto em hakka é "vu", mas o símbolo para ambos é o mesmo). Já os dialetos yue (também conhecido como cantonês, o idioma oficial de Hong Kong e Macau), min (ou hokkien, o idioma oficial de Taiwan) e wu (o segundo mais falado na China) usam cada um um conjunto de símbolos próprio, sendo que alguns símbolos (cerca da metade) são comuns com o mandarim, mas alguns destes (cerca de 30%) possuem significados diferentes daqueles que têm em mandarim (por exemplo, há um símbolo que significa "filhote", sendo usado apenas para animais, em mandarim, mas "criança", sendo usado apenas para pessoas, em cantonês). Não importa se o símbolo é do mandarim, cantonês, wu, min, chinês simplificado ou tradicional, todos são considerados parte de um mesmo conjunto.

Os hieróglifos egípcios já possuíam um conjunto de ideogramas (no caso, pictogramas, já que eram figuras, e não símbolos), usado junto aos que representavam as consoantes, para que palavras que se repetissem muito (como "homem", "faraó" ou "morte") pudessem ser representadas sem que fossem escritas letra por letra, economizando espaço; atualmente, o idioma japonês faz algo parecido, utilizando um conjunto de símbolos conhecido como kanji, composto por cerca de 13.000 símbolos, junto ao hiragana e ao katakana. Além de representar uma ideia completa, os kanji podem ser combinados de acordo com seu som para formar nomes próprios, justamente como o hiragana e o katanaka - o próprio nome do Japão em japonês, Nippon, é escrito com dois kanji, que significam, separadamente, "origem" e "sol", e deram ao país seu apelido de "Terra do Sol Nascente". Assim como o governo chinês, o japonês se preocupa com o fato de que é bastante difícil fazer com que todo o seu povo decore todos os kanji, então criou duas soluções: a primeira foi uma lista, elaborada na década de 1960, contendo entre 2 e 3 mil kanji que todo japonês deve saber ao concluir o Ensino Fundamental, e que correspondem às palavras mais comuns do idioma, sendo atualizada conforme necessário; a segunda foi que os kanji, quando aparecem em algum texto no qual possam não ser compreendidos por uma grande parcela da população, como em um jornal ou legenda de filme, são sempre acompanhados do furigana, um pequeno texto escrito em hiragana acima do kanji, soletrando-o - em um exemplo tosco, "água", em japonês, é mizu, então, acima do kanji de água, teríamos os hiragana das sílabas MI e ZU.

Os kanji japoneses e os ideogramas chineses são hoje os dois únicos conjuntos de ideogramas ainda em uso, mas, até bem pouco tempo, eles tinham dois companheiros, os hanja coreanos e o chu-nom, conjunto de ideogramas usado no Vietnã até a década de 1920, quando foi abandonado em prol do alfabeto latino - embora ainda possa ser possível aprender chu-nom, principalmente porque ainda existem muitos textos antigos escritos com esse sistema que ainda não foram convertidos.

Para terminar de vez, cabe falar que nem todo alfabeto hoje existente foi criado para ser usado em conjunto com um idioma específico, com muitos tendo sido desenvolvidos para facilitar a transmissão, aprendizado ou compreensão da língua. Podemos citar, como exemplo, o alfabeto braille, criado pelo professor francês Louis Braille em 1824 para a alfabetização de deficientes visuais, e que utiliza pontos em alto relevo em um papel duro, percebidos através das pontas dos dedos, para representar consoantes e vogais, podendo ser adaptado facilmente para qualquer idioma; o Alfabeto Internacional de Fonemas, aquele que aparece nos dicionários para explicar a pronúncia das palavras, criado pela Associação Internacional de Fonética em 1888, e desenvolvido para que qualquer som de qualquer idioma possa ser expressado sem dúvidas por seus 107 símbolos (nele, por exemplo, o NH do português, o GN do italiano e o Ñ do espanhol possuem o mesmo símbolo); e o Código Morse, criado pelo inventor norte-americano Samuel Morse em 1844 para que mensagens pudessem ser transmitidas através do telégrafo, um aparelho que envia pulsos elétricos que são então marcados como pontos e traços em uma tira de papel por um receptor. Isso sem contar os alfabetos ficcionais, como o Tengwar dos elfos de J.R.R. Tolkien ou o Klingon de Star Trek, criados para dar a povos fictícios um maior grau de veracidade - já que, como vimos, se existe quase uma centena de sistemas de escrita diferentes apenas em nosso planeta, não faria muito sentido se raças fantásticas e alienígenas usassem os mesmos que nós.

segunda-feira, 26 de dezembro de 2016

Alfabeto (I)

0 Comentários:

Postar um comentário

Busca

Posts Aleatórios

Total de visualizações de página

Traduzir

Seguidores