ELCIANO
terça-feira, setembro 23, 2003
 
50 anos depois...
Ainda a propósito do postAs We May Think”. As ideias que Bush registou neste artigo foram realmente de extrema importância tanto para a evolução científica/tecnológica como para a própria comunidade científica. A prova disso está na realização de um Simpósio comemorativo dos 50 anos (em 1995) de “As We May Think”. (Não é frequente ocorrerem conferências dedicadas a um artigo e suas ideias).

O nome do Simpósio é “50 Years After ‘As We May Think': The Brown/MIT Vannevar Bush Symposyum”. Dada a multidisciplinaridade da área de hipermédia, participaram neste encontro personalidades distintíssimas cujas formações têm, tipicamente, poucos pontos em comum. Aponto alguns:

Paul Penfield: Professor de Engenharia Electrotécnica e Presidente do Departamento de Engenharia Electrotécnica e Informática do MIT.
Tim-Berners Lee: Criador da World Wide Web. Laboratory for Computer Science/MIT.
Alan Kay: Criador do conceito de “Computador Pessoal” e do paradigma da Programação Orientada a Objectos. Apple Computer.
Dr. Raj Reddy: Professor de Informática e Robótica. “Dean” da School of Computer Science da Carnegie Mellon University.
Douglas Carl Englebart: Inventor do rato e telecolaboração interactiva em tempo real. Criador do hipertexto e ferramentas de navegação. Fundador do Bootstrap Institute.
Ted Nelson: Criador de um novo mundo de interactividade com os media.
.
.
Douglas N. Adams: Escritor na área de ficção-científica. Escreveu o popular “The Hitch-Hicker’s Guide To The Galaxy”.
Paul Khan: Literatura e Tipografia. Trabalhos na área dos sistemas de publicação digital.
.
.

Estes senhores discutiram as ideias de Bush e compararam as funcionalidades do Memex com as disponíveis nos dias de hoje. Constataram que ainda há muito trabalho a fazer. Numa perspectiva futurista, apresentaram novas visões de organização e processamento de informação e projectaram a sua concretização para 2010.

sábado, setembro 20, 2003
 
INQUER – Interacção Pessoa-Máquina em Linguagem Natural
Apresentada a WordNet.PT, há agora condições para dar a conhecer o INQUER. Este projecto foi também desenvolvido pelo CLG – Grupo de Computação do Conhecimento Léxico-Gramatical e consiste na construção de um Sistema Pergunta-Resposta para o Português.

O utilizador coloca uma pergunta ao INQUER; o sistema compreende a pergunta; consulta a base de conhecimento (WordNet.PT); extrai uma resposta e apresenta-a ao utilizador.

O INQUER, construído usando o paradigma da Programação em Lógica e a linguagem Prolog, divide-se em três Módulos que se complementam, a saber:

- Módulo I – Análise Sintáctico-Semântica;
- Módulo II – Inferência e Extracção de Informação;
- Módulo III – Geração em Linguagem Natural.

O Módulo I foi desenvolvido pela minha querida colega Catarina Ribeiro, tendo o Módulo II ficado à minha responsabilidade. O Módulo III está em fase de conclusão.

O site do projecto tem mais informação e possibilita testar o sistema numa pequena demonstração.

terça-feira, setembro 16, 2003
 
"As We May Think"
Em Julho de 1945 a revista “The Atlantic Monthly” publica um artigo de Vannevar Bush intitulado “As We May Think”. Nascia então o conceito de hipermédia e uma nova forma de pensar em relação à organização da informação e ao uso da tecnologia como aliada do ser humano.

Neste artigo Bush idealiza um sistema denominado Memex que se aproxima de o que é hoje a World Wide Web.

«Consider a future device for individual use, which is a sort of mechanized private file and library. It needs a name, and, to coin one at random, "memex" will do. A memex is a device in which an individual stores all his books, records, and communications, and which is mechanized so that it may be consulted with exceeding speed and flexibility. It is an enlarged intimate supplement to his memory.»

Transcrevo aqui apenas um parágrafo para abrir o apetite. Vale mesmo a pena ler o artigo completo [aqui].

É realmente fascinante (a esta distância) ler os escritos e conhecer as ideias de um visionário que, ainda no contexto da Segunda Guerra Mundial, vislumbrava um sistema em que muitas das funções se transformaram hoje em banalidades.
domingo, setembro 14, 2003
 
A Ciência
A ciência, a ciência, a ciência...
Ah, como tudo é nulo e vão!
A pobreza da inteligência
Ante a riqueza da emoção!

Aquela mulher que trabalha
Como uma santa em sacrifício,
Com tanto esforço dado a ralha!
Contra o pensar, que é o meu vício!

A ciência! Como é pobre e nada!
Rico é o que alma dá e tem.



Fernando Pessoa


Inquietante hein...
 
WordNet.PT
A WordNet.PT é uma base de dados de conhecimento linguístico do Português susceptível de ser utilizada em várias áreas da Linguística Computacional e da Engenharia da Linguagem, tais como tradução automática, sistemas de busca e de extracção de informação, sistemas periciais, aplicações para o ensino do Português, entre outras.
A base de dados é organizada de acordo com o modelo geral da EuroWordNet, uma base de dados multilingue que integra WordNets de várias línguas europeias. Uma WordNet é uma rede léxico-conceptual estruturada em torno de um conjunto de relações que a investigação tem vindo a demonstrar corresponder à organização mental do significado lexical. O significado de uma dada unidade é deduzido da sua posição relativa no complexo de relações especificadas na rede, sendo a restante informação - glosas e etiquetas, nomeadamente - de carácter complementar.
A unidade básica de uma WordNet é o conceito. Cada conceito corresponde a um nó da rede e é representado pelo conjunto das expressões lexicais que lhe correspondem, sejam elas atómicas ou complexas.

Este projecto é desenvolvido pelo Grupo de Computação do Conhecimento Léxico-Gramatical do Centro de Linguística da Universidade de Lisboa. Existe uma versão on-line que pode ser consultada e testada aqui.

sábado, setembro 13, 2003
 
LC / PLN / EL
Conceitos como Linguística Computacional, Processamento de Linguagem Natural e Engenharia da Linguagem são por vezes confundidos. Ténues diferenças conferem-lhes estatuto próprio. Estabeleço aqui essas diferenças numa tentativa de definição de cada uma destas áreas.

LC
A Linguística Computacional é uma ciência que estuda a linguagem natural tal como a Linguística tradicional. A diferença está no facto de utilizar computadores para auxiliar o trabalho de modelização de teorias linguísticas (muitas vezes para provar a sua consistência ou inconsistência) ou outro tipo de trabalho tipicamente do domínio da Linguística tradicional.

PLN
Enquanto a LC é um ramo da linguística que usa computadores para melhorar/facilitar a resolução de problemas, o Processamento de Linguagem Natural é um ramo de informática. Inclui (i) o desenvolvimento de algoritmos de parsing (análise gramatical), geração e aquisição/representação de conhecimento, (ii) investigação associada à complexidade de tais algoritmos, (iii) concepção de linguagens formais (formalismos gramaticais e lexicais) úteis para a codificação do conhecimento linguístico, (iv) investigação acerca de arquitecturas de software apropriadas para as diversas tarefas de PLN, (v) consideração acerca do tipo de conhecimento não-linguístico envolvido em PLN.

EL
A Engenharia da Linguagem tem a seu cargo a aplicação do PLN. Envolve a construção de artefactos (programas) computacionais inteligentes (capazes de processar linguagem natural) que possam ser usados pelo utilizador comum e não apenas por linguistas computacionais. São exemplos deste tipo de programas, aqueles a que fiz referência no post “Mas afinal o que é ELC? 1”. Tradutores automáticos, Sistemas de Reconhecimento/Síntese de Fala, etc.

Para informação mais detalhada acerca deste tema, pode consultar-se o artigo de Hamish Cunningham intitulado “A Definition and Short History of Language Engineering” que é já de 1999 mas continua actual.

domingo, setembro 07, 2003
 
Para breve
Não posso deixar de agradecer ao Formiga de Langton o elogioso cumprimento. Fico muito satisfeito por obter feedback de um blog que se tornou uma referência incontornável na blogosfera portuguesa e que me habituei a ler com muita frequência. Espero estar à altura do desafio e contribuir para a divulgação que a área merece.

Em breve, e antes de partir para a apresentação de projectos portugueses, farei a distinção entre termos (habitualmente) confundidos: Linguística Computacional, Processamento de Linguagem Natural e Engenharia da Linguagem.
terça-feira, setembro 02, 2003
 
Será esta teoria falsificável?
Um enunciado (uma teoria, uma conjectura) tem o estatuto de pertencer às ciências empíricas se e só se for falsificável.
Karl Popper, in Pós-Escrito à Lógica da Descoberta Científica – O Realismo e o Objectivo da Ciência

 
Miradouros
Fiz uma pequena viagem pelo centro e norte de Portugal. Paisagens maravilhosas, algumas elevadas a paraíso quando se vive na cidade. Penacova, Arganil, Tábua, Viseu, Castro Daire, Arouca, Vale de Cambra, Sever do Vouga, Conimbriga.
Passei por dezenas de miradouros devidamente sinalizados. O que tenho a constatar é o facto de a grande maioria deles estar muito mal tratada. Parei em muitos e, em vez de desfrutar da bela paisagem que justifica(ou) a construção de um local para a apreciar, deparo-me com arvoredo e vegetação serrada à distância de dois palmos da cara. Tive de parar algumas vezes na estrada para poder contemplar a Natureza.

 
Mas afinal o que é ELC? 2
A área de Engenharia da Linguagem e do Conhecimento esteve contemplada numa licenciatura, com o mesmo nome, única no país, leccionada em parceria pelas Faculdades de Ciências e de Letras da Universidade de Lisboa. Digo esteve porque encerrou em 2001 (por motivos misteriosos) dando lugar a um ramo de especialização da licenciatura em Informática da Faculdade de Ciências da UL.
Quem por ventura estiver interessado nesta área a nível académico tem três possibilidades: (i) ramo de Informática, (ii) estudos pós-graduados (nomeadamente mestrados) ou (iii) optar pelo estrangeiro.

quarta-feira, agosto 27, 2003
 
Pausa
O Flor de Obsessão vai fazer uma pausa! É um blog que leio com frequência e que considero dos mais interessantes.
Embora eu tenha começado agora nestas lides, acho que consigo perceber que a dada altura se torne quase imperativo parar por uns tempos. Mas "nada de requiems e outros lamentos"...
Bom descanso Pedro!
segunda-feira, agosto 25, 2003
 
Mas afinal o que é ELC? 1
A Engenharia da Linguagem e do Conhecimento é um ramo da Inteligência Artificial que se debruça sobre o tratamento informático (inteligente) das línguas. É uma mistura de duas disciplinas - a Engenharia da Linguagem e a Engenharia do Conhecimento – que assenta sobretudo em três grandes áreas científicas: Linguística, Informática e Matemática (com incursões pelas Ciências Cognitivas, Filosofia da Linguagem e Psicologia).

Pensarão: “ah já sei.. correctores ortográficos...”. Também, mas não só. Aliás será demasiado redutor pensar que a ELC serve apenas para construir correctores ortográficos e/ou outros sistemas semelhantes. (A verdade é que podemos construir um corrector ortográfico sem que o mesmo tenha um mínimo de inteligência. Mera comparação de vocábulos).

A ELC permite-nos construir, por exemplo, Sistemas de Reconhecimento/Síntese de Fala, Sistemas de Sumarização de Textos, Sistemas de Pergunta-Resposta, Correctores Sintácticos e Semânticos, Tradutores Automáticos e todos os Sistemas de Interacção Pessoa-Máquina em Linguagem Natural. Lembram-se do HAL9000 no 2001 Odisseia no Espaço?

Esta área está, em Portugal, muito pouco desenvolvida e, ainda por cima, a ser muito mal tratada (explicarei a razão desta afirmação). No estrangeiro a área é muito mais respeitada e desenvolvida, nomeadamente nos Estados Unidos da América (onde se fazem trabalhos notabilíssimos) e, a nível europeu, na Alemanha.
Continua...
domingo, agosto 24, 2003
 
Ontem Dor, Hoje Festa
Visitei hoje a Feira de Artesanato de Peniche. Interessante. À semelhança de outras, podemos apreciar artesanato de vários países: Portugal, Senegal, Peru, Egipto, Índia, etc.

O aspecto que gostaria de relevar é o de que esta Feira se tenha realizado no recinto interno (mas ao ar livre) do Forte de Peniche. Sente-se um misto de sentimentos cuja mistura é, no mínimo, incomodativa. O suposto lazer é atropelado pelos calafrios que aquele local ainda me provoca. Sem pedir licença, recordações de histórias horrendas que li e me foram contadas, inundaram os meus pensamentos. A tortura e a dor silenciosa continuam talhadas naquelas paredes. Não consigo divertir-me onde outrora se torturou.

Não haverá sítios mais convenientes para se realizar uma feira? Será ético fazer uma feira numa antiga prisão onde se torturava barbaramente? Respeitar-se-ão assim ex-presos políticos que lá sofreram?

Contudo, talvez seja até benéfico apagar das memórias locais e ambientes que fazem mal à alma. Talvez... ou será melhor manter (o mais fielmente possível) a tenebrosidade associada ao Forte de Peniche para nos lembrarmos de nunca ir por aí? Não sei...
 
Olá!
Antes de tudo quero lançar um Olá! a toda a blogosfera portuguesa e apresentar algumas considerações acerca do que me levou a criar um/este blog.
Durante algum tempo limitei-me a conhecer a blogosfera portuguesa lendo, com uma regularidade cada vez mais assídua, blogs que considero verdadeiramente interessantes e, de alguma forma, responsáveis pela existência deste (Abrupto, Bomba Inteligente, A Formiga de Langton,...).
Ao longo desse período, duas perguntas sustentavam a minha renitência em criar um blog: (i) "Fazer um blog para quê?", (ii) "Esta coisa dos blogs não será uma moda efémera?".
Encontrei respostas (para mim) satisfatórias. Primeira: registar, concretizar e, quem sabe, desenvolver ideias e reflexões que, por pequenas e simples que sejam, merecem não se volatilizar (o que tantas vezes acontece); divulgar a tão desconhecida área de Engenharia da Linguagem e do Conhecimento; homenagear Pessoa e suas pessoas (bem sei que há muitos a fazê-lo, mas aqui é à minha maneira!) e, por último, porque não tornar tudo isto público em vez de o guardar em gavetas por entre circunvoluções cerebrais com puxadores feitos de memórias? (até me vai ajudar a organizar o seu conteúdo). Segunda: efectivamente, parece-me uma moda, mas não tão efémera como desconfiei.
Aqui vou eu...

Powered by Blogger