síntese de imagem baseada em light fields: concepção e desenvolvimento de uma aplicação didáctica brígida mónica teixeira de faria faculdade de engenharia da universidade do porto departamento de engenharia electrotécnica e de computadores rua roberto frias, s/n, 4200-465 porto, portugal dezembro de 2007 síntese de imagem baseada em light fields: concepção e desenvolvimento de uma aplicação didáctica brígida mónica teixeira de faria licenciada em matemática pela faculdade de ciências da universidade do porto dissertação realizada no âmbito do mestrado em tecnologia multimédia da faculdade de engenharia da universidade do porto, orientada pelo professor doutor antónio augusto de sousa. faculdade de engenharia da universidade do porto departamento de engenharia electrotécnica e de computadores rua roberto frias, s/n, 4200-465 porto, portugal dezembro de 2007 resumo o desenvolvimento praticado na área de computação gráfica permitiu aspirar pela modulação de cenas sem recurso aos dados concretos sobre a geometria da mesma. vários métodos foram criados e aplicados por diversos investigadores, sendo de realçar os métodos de light fields e lumigraph. este trabalho apresenta o percurso efectuado pela comunidade científica para se conseguir atingir este patamar de investigação, na qual se insere a técnica de image based rendering analisada: os light fields. para compreender a técnica light field foi essencial contextualizá-la apresentando conceitos físicos e matemáticos que permitiram justificar os pressupostos de simplificação da plenoptic function. esta função traduz o mundo observável, sendo a sua dimensão composta por sete variáveis. deste modo são compreensíveis os caminhos alternativos que foram criados para simplificar e reduzir o seu número de variáveis. com a utilização da parametrização da técnica de light fields, foi possível atingir a dimensão quatro para esta função. a diminuição do número de variáveis implica algumas desvantagens, na medida em que a qualidade da imagem, flexibilidade e realismo são também reduzidas. contudo, a diminuição da qualidade poderá não ser um obstáculo para a utilização da técnica dos light fields, desde que os fins a atingir não necessitem de uma elevada qualidade de imagem. no trabalho é ainda apresentado um estudo teórico de light fields: a definição, a geometria básica necessária, a descrição das parametrizações possíveis e dos planos utilizados. o conhecimento da técnica dos light fields não é intuitivo e é pouco explorado pela comunidade científica ligada à computação gráfica. com base nesta constatação pretendeu-se investigar se seria possível, através da criação de um sítio web e do desenvolvimento de uma aplicação de visualização de light fields, transmitir, de modo eficiente, o conhecimento teórico e prático da técnica a indivíduos com bons conhecimentos de informática. a investigação baseou-se no pressuposto de que o progresso da multimédia e a sua utilização em aplicações didácticas são fortes aliados para o incremento dos conhecimentos e aceleração do processo de aprendizagem, na medida em que através de imagens, hipertexto, gráficos e vídeos, entre outros, se obtém uma maior exploração dos conceitos e aumento da motivação dos utilizadores. na construção do sítio web foi prevista a aplicação destes elementos multimédia e, ao introduzir este modo de divulgação de conhecimento, foi previamente estabelecido o modelo educacional a utilizar, sabendo à partida, que o utilizador seria, em grande parte, autónomo no processo de aprendizagem. o desenvolvimento da aplicação de visualização de light fields foi realizado usando como base componentes criados previamente por marc levoy e pat hanrahan na universidade de stanford, auxiliando a enriquecer a componente didáctica do sistema. a vertente didáctica de divulgação da técnica dos light fields foi alvo de estudo através da realização de um inquérito tendo em vista a pesquisa de informação sobre o nível de conhecimento adquirido por utilizadores, com diferentes conhecimentos de computação gráfica, após a análise do sítio web e aplicação de visualização. o estudo procurou obter informação adicional sobre as características do utilizador e o nível de desenvolvimento das suas competências após a aprendizagem dos conceitos averiguando a diferença no processo de aprendizagem para indivíduos com e sem bases na área de computação gráfica. uma série de dados foi retirada, analisada, utilizando a ferramenta spss, e aplicando a teoria subjacente à estatística inferencial, em particular, aos testes de hipóteses, de forma a ser possível a obtenção de evidências estatísticas quanto às melhorias notadas num conjunto de utilizadores que tiveram contacto com o sítio web e aplicação de visualização dos light fields. os resultados obtidos permitem concluir que o nível de conhecimento sobre light fields aumentou após o acesso ao sítio web. apesar de esta conclusão ser relativamente esperada à partida, foi de certo modo interessante verificar que o grupo de indivíduos com conhecimentos em computação gráfica (cg) beneficiou e compreendeu muito melhor os conceitos após a utilização da aplicação de visualização do que o grupo sem conhecimentos nesta área. na realidade, o grupo sem conhecimentos em computação gráfica viu os seus conhecimentos aumentarem significativamente relativamente ao conceito de light field e outros conceitos directamente associados enquanto que no grupo com bons conhecimentos de informática mas fracos conhecimentos em cg não se observou este fenómeno com um nível de significância estatisticamente válido, concluindo-se que a aplicação desenvolvida é apropriada, sobretudo, a indivíduos com conhecimentos em computação gráfica, grupo para o qual a mesma era originalmente destinada. abstract the recent developments in the computer graphics area enabled to aspire developing scene modeling without its concrete geometric data. several methods were developed and applied by distinct researchers in the field with emphasis on light fields and lumigraph methods. this work presents the scientific community research to achieve this research goal in which the analyzed image based rendering technique of light fields is included. in order to fully understand light fields it was necessary to contextualize this technique and to present its main physical and mathematical concepts that enable to justify the plenoptic function simplifying conditions. this function translates the observable world in a seven dimensional function. in this way it is possible to understand the alternative ways to simplify this function reducing its number of variables. with the use of light fields it was possible to reduce to four the number of variables. however, this reduction implies also some disadvantages such as the reduction of the image quality, flexibility and realism. depending on the desired image quality of the application this may or may not be a serious disadvantage. in the work it is also presented a theoretical study of light fields from its definition, necessary basic geometry, possible parameterizations and image planes used. the light field technique knowledge is not intuitive and as such it is not deeply explored by the computer graphics scientific community. having this conclusion as basis a study was developed in order to investigate the possibility of efficient knowledge transmition, of this technique, to users with good knowledge in computer science, by using a web site and an associated light fields visualization application. the research was based on the idea that multimedia progress and its use in didactic applications are strong allies to the knowledge increase and learning process acceleration, by using images, hypertext, graphics and videos, among other, in order to achieve deeper concept exploration and increased motivation. the web site was built having in consideration this concerns and using an educational model based on user autonomous learning. the light field visualization application was based on components created by marc levoy and pat hanrahan at the university of stanford, enabling to increase the autonomous didactic potential of the global system. the light fields didactic component was investigated through an inquiry aiming to research the knowledge increase achieved by users with previous good knowledge in computer science and distinct level of expertise in computer graphics after analysing the web site and the associated visualization application. the data gathered was analysed using spss tool applying the underlying inferential statistics and hypotheses test methodologies, in order to understand the knowledge evolution of the users after analysing the web site and application. the results achieved enable to conclude that the global level of knowledge about light fields and all related concepts increased after a short period of study of the web site. although this conclusion was expected, it is somewhat surprising to verify that the group with good knowledge in computer graphics could benefit and learn a lot more than the group with reduced knowledge on this area, by using the light field visualization application. this enables to take the conclusion that the developed multimedia learning system is appropriate for individuals with good knowledge in computer graphics as it was its original objective. aos meus pais, pedro, filipe, e luís. com amor e carinho… agradecimentos na elaboração deste trabalho foram vários os que contribuíram para que fosse possível atingir o fim desta dissertação. em primeiro lugar, agradecer ao professor doutor a. augusto de sousa pela proposta deste tema, pela dupla função de orientador e conselheiro na execução do trabalho e por me ter sempre procurado proporcionar as melhores condições na execução do mesmo. gostaria também de lhe agradecer pelas excelentes aulas de sistemas gráficos interactivos, que me despertaram o interesse pela área da computação gráfica e me motivaram à realização desta tese. recordo também que a ajuda do nuno lau foi fundamental para a instalação e execução inicial do programa e a contribuição do joão paredes e carlos campos que me permitiram aprender rapidamente os comandos base em linux. agradeço também à kajal ratanji pelos conselhos em termos de design, cor e adequação dos elementos multimédia. a palavra obrigada vai ao encontro do professor doutor eurico carrapatoso, na qualidade de director de mestrado, que esclareceu as dúvidas perante a organização do mestrado em tecnologia multimédia e a todos os professores que leccionaram as disciplinas do primeiro ano, que contribuíram, sem dúvida, para o enriquecimento dos meus conhecimentos na área da multimédia. o modo como estruturaram o plano de estudos permitiu que alunos de diferentes formações de base interligassem e partilhassem saberes. queria agradecer ao pedro pela paciência, pela leitura do trabalho, pela identificação, análise e esclarecimento das mais valias do trabalho e, enfim, pelos conselhos e preocupações de irmão mais velho. ao filipe que sempre esteve presente para tudo o que era preciso, não hesitando em ajudar. aos meus pais que conseguiram transmitir os valores que tornam, em grande parte, aquilo que sou hoje e que está reflectido nas linhas que constituem o presente trabalho. palavras para ti, luís, não são suficientes, mas estariam todas ao mais alto nível! pela leitura do trabalho, pela motivação (quando mais precisei), pelo rumo dado e pela partilha do entusiasmo científico e não só… índice ix índice 1. introdução 1 1.1 enquadramento e motivação...............................................................................................1 1.2 objectivos............................................................................................................................2 1.3 estrutura da dissertação......................................................................................................3 2. equação de radiância 5 2.1 luz.......................................................................................................................................6 2.2 pressupostos de simplificação ............................................................................................9 2.2.1 independência do comprimento de onda.....................................................................9 2.2.2 tempo invariante..........................................................................................................9 2.2.3 transporte de luz em espaço livre ..............................................................................10 2.2.4 objectos são isotrópicos .............................................................................................10 2.3 radiância...........................................................................................................................10 2.4 reflexão ............................................................................................................................13 2.5 equação de radiância .......................................................................................................15 2.6 soluções da equação de radiância ...................................................................................16 2.6.1 flat-shaded graphics.................................................................................................18 2.6.2 real-time graphics....................................................................................................18 2.6.3 ray tracing.................................................................................................................18 2.6.4 monte carlo path tracing..........................................................................................20 2.6.5 radiosity .....................................................................................................................20 2.6.6 monte carlo photon tracing......................................................................................21 2.7 cálculo de visibilidade .....................................................................................................22 2.8 o problema de iluminação em image based rendering...................................................23 2.9 sumário do capítulo..........................................................................................................23 3. image based rendering 24 3.1 plenoptic function ............................................................................................................25 3.2 restrição do espaço de vista ............................................................................................27 índice x 3.2.1 pressupostos para restringir o campo de vista .........................................................27 3.2.1.1 comprimento de onda .........................................................................................28 3.2.1.2 radiância constante.............................................................................................28 3.2.1.3 eliminação do tempo ..........................................................................................28 3.2.1.4 restrição aplicada ao movimento num plano.....................................................29 3.2.1.5 restrição aplicada ao movimento num caminho ...............................................30 3.2.1.6 observador numa posição fixa............................................................................30 3.3 representações e o processo de rendering.......................................................................30 3.3.1 surface plenoptic function.........................................................................................30 3.3.2 plenoptic modeling e light field video.....................................................................31 3.3.3 light fields e lumigraph ...........................................................................................31 3.3.4 concentric mosaics ....................................................................................................33 3.3.5 image mosaicing.........................................................................................................35 3.4 amostragem ......................................................................................................................36 3.5 compressão .......................................................................................................................37 3.6 sumário do capítulo..........................................................................................................40 4. light fields 41 4.1 definição e representação do light field ........................................................................42 4.2 geometria básica e sistema de coordenadas ...................................................................44 4.3 rendering: interpolação ....................................................................................................45 4.4 representações de light fields.........................................................................................49 4.5 mais desenvolvimentos no estudo dos light fields ........................................................51 4.6 sumário do capítulo..........................................................................................................52 5. aplicação didáctica de light fields 53 5.1 modelos educacionais.......................................................................................................54 5.2 interactividade e visualização...........................................................................................57 5.3 modelo da aplicação.........................................................................................................58 5.4 aplicação base utilizada – lightpack 1.0........................................................................60 5.4.1 introdução...................................................................................................................60 5.4.2 criação de um light field ..........................................................................................61 5.4.3 visualização de um light field..................................................................................61 5.4.4 arquitectura do sistema..............................................................................................61 índice xi 5.4.5 formato do ficheiro light field..................................................................................62 5.4.6 rendering (volvis e volpack) ....................................................................................64 5.5 aplicação didáctica de visualização................................................................................65 5.5.1 plataforma de desenvolvimento seleccionada...........................................................66 5.5.2 potencialidades requeridas ao sistema......................................................................67 5.5.3 interface gráfica da aplicação ...................................................................................68 5.6 sítio web didáctico ..........................................................................................................70 5.6.1 plataforma de desenvolvimento seleccionada...........................................................70 5.6.2 potencialidades requeridas ao sistema......................................................................71 5.6.3 interface gráfica da sítio web ...................................................................................72 5.7 sumário do capítulo..........................................................................................................74 6. estudo exploratório 75 6.1 metodologia e objectivos .................................................................................................75 6.2 população e amostra.........................................................................................................79 6.3 procedimentos ...................................................................................................................82 6.4 resultados obtidos............................................................................................................87 6.5 discussão e análise dos resultados..................................................................................92 7. conclusões e perspectivas de desenvolvimento 95 referências bibliográficas 97 anexo 1- questionário sobre light fields 104 lista de figuras xii lista de figuras figura 1: espectro electromagnético da radiação. .........................................................6 figura 2: radiância como o fluxo por unidade de área projectada por unidade de ângulo sólido..................................................................................................................11 figura 3: fluxo entre duas superfícies elementares. .....................................................11 figura 4: direcção da reflexão caso a superfície seja especular................................13 figura 5: reflexão difusa: a luz radia num hemisfério à volta de um ponto da superfície..........................................................................................................................14 figura 6: ilustração da equação de radiância. ...............................................................16 figura 7: imagem gerada utilizando ray tracing...........................................................19 figura 8: imagem gerada utilizando monte carlo path tracing................................20 figura 9: imagem gerada utilizando radiosity................................................................21 figura 10: paradigmas gbr e ibr. .......................................................................................25 figura 11: sistema de coordenadas da localização espacial e direcção de vista...26 figura 12: conjunto de 128 câmaras construído para o projecto inicial stanford immersive television da universidade de stanford...............................................29 figura 13: parametrização do light field ........................................................................32 figura 14: processo de discretização dos planos uv e st. ..............................................33 figura 15: captura de concentric mosaic [shum e he, 1999].........................................33 figura 16: exemplo de um panorama utilizando image mosaicing...............................35 figura 17: representação discreta de um light field (um light slab)........................43 figura 18: sistema de coordenadas dos pontos nos planos uv e st. .............................45 figura 19: uma imagem é criada para cada ponto no plano st......................................46 figura 20: síntese de imagem para um novo ponto de vista............................................46 figura 21: utilização de texture mapping........................................................................47 figura 22: interpolação quadrilinear...............................................................................48 figura 23: o suporte para a base quadrilinear. ...............................................................49 figura 24: parametrizações do light field (à esquerda dois planos, no centro parametrização esférica e à direita representação através de um ponto e uma direcção). .........................................................................................................................50 lista de figuras xiii figura 25: grau do controlo, síntese e envolvimento de conhecimento em aprendizagem baseada na utilização do computador (adaptado de [hammond, 1993])..................................................................................................................................58 figura 26: nível de controlo, síntese e envolvimento do utilizador........................59 figura 27: exemplo de um cabeçalho do formato “.lif”. ................................................63 figura 28: exemplo de um segmento slab...........................................................................63 figura 29: esquema da interface gráfica da aplicação de visualização de light fields.................................................................................................................................68 figura 30: interface do programa de visualização de light fields............................68 figura 31: visualização de uma rotação de 360º de um light field.............................69 figura 32: esquema do sítio web sobre light fields.......................................................73 figura 33: imagem da sessão sobre mais desenvolvimentos na área de light fields. ............................................................................................................................................74 figura 34: aspecto geral do questionário elaborado. ..................................................77 figura 35: interface do site da aplicação didáctica de light fields.........................78 figura 36: gráfico das percentagens das habilitações literárias da amostra. ......80 figura 37: gráfico das percentagens do sexo dos inquiridos. ......................................80 figura 38: diagrama esquemático do processo dos testes de hipóteses. ...................84 figura 39: diagrama esquemático da escolha dos testes de hipóteses......................85 lista de tabelas 1 lista de tabelas tabela 1: frequência da idade dos indivíduos da amostra............................................79 tabela 2: tipo de conhecimentos em computação gráfica vs experiência com programas de visualização de imagens.....................................................................81 tabela 3: nível de conhecimentos em computação gráfica. ........................................81 tabela 4: nível de conhecimento do conceito de ibr. ....................................................82 tabela 5: nível de conhecimento do conceito de light field.......................................82 tabela 6: evidências estatísicas quanto às diferenças do nível de conhecimento após análise do sítio web. ............................................................................................87 tabela 7: frequência absoluta e relativa do nível de compreensão do conceito de luz antes da análise do sítio web. .............................................................................88 tabela 8: frequência absoluta e relativa do nível de compreensão do conceito de luz após análise do sítio web......................................................................................88 tabela 9: frequência absoluta e relativa do nível de compreensão do conceito de light field. ......................................................................................................................88 tabela 10: frequência absoluta e relativa do nível de compreensão do conceito de light field após análise do sítio web........................................................................89 tabela 11: evidências estatísicas quanto às diferenças do nível de conhecimento experiência com o programa de visualização de lfs. ............................................90 tabela 12: evidências estatísticas quanto às diferenças do nível de conhecimento após experiência com o programa de visualização de lfs em indivíduos sem conhecimento em cg......................................................................................................91 tabela 13: evidências estatísicas quanto às diferenças do nível de conhecimento após experiência com o programa de visualização de lfs em indivíduos com conhecimento em cg......................................................................................................91 capítulo 1 1. introdução 1.1 enquadramento e motivação a área da computação gráfica (cg) tem especial relevo e importância perante os utilizadores e programadores de aplicações informáticas. a computação gráfica é um subcampo da informática ou ciências da computação que está relacionada com a síntese digital e manipulação de conteúdos visuais utilizando técnicas computacionais. embora o termo computação gráfica se refira essencialmente a gráficos tri- dimensionais, também abrange gráficos bidimensionais e processamento de imagem. a computação gráfica inclui como subcampos: geometria, que estuda métodos de representação e processamento digital de superfícies e objectos; animação, que estuda métodos de representação e manipulação de superfícies que se movimentam e deformam ao longo do tempo e síntese de imagem, que estuda métodos de reprodução do transporte da luz e de geração de imagens a partir de modelos. a computação gráfica iniciou-se na década de 60 com especial relevo para o trabalho na universidade de utah (de salt lake city nos e.u.a.), com a apresentação de alternativas no campo de desenho vectorial, representação tridimensional em ambientes bidimensionais, mapeamento de texturas, entre outros princípios ainda que básicos, mas que rapidamente atingiram desenvolvimentos evidentes na área. uma descrição detalhada da evolução da computação gráfica pode ser encontrada em [carlson, 2007]. o progresso da computação gráfica foi introduzido nos ramos da engenharia, indústria e entretenimento, sendo que a sua evolução partiu dos primeiros gráficos criados através da linha de comandos até aplicações que vão além de gráficos vectoriais, ou seja, utilização de imagens na criação de cenas tridimensionais. há alguns anos, para se ter um equipamento capaz de executar software avançado de cg era necessário uma plataforma silicon graphics ou equivalente, que não estava ao capítulo 1: introdução 2 alcance de todos, bem como programas de animação que também não eram de fácil acesso aos utilizadores em geral. nos dias correntes é possível o acesso aos principais programas gráficos e de animação avançados, em plataformas de baixo custo como pcs, o que torna ainda mais trivial o manejo, para aplicações não profissionais, que permitem construir modelos e cenas tridimensionais, bem como construir e manipular os próprios filmes de animação. os computadores pessoais (pcs) constituem hoje, na realidade, a plataforma mais barata mas, ainda assim, bastante eficiente para a computação gráfica. deste modo, praticamente todo o software de animação e visualização acabou por migrar ou ter versões para a plataforma windows em pcs. perante o facto da premente manifestação de aperfeiçoamento, o estudo desenvolvido no âmbito deste trabalho vai ao encontro das principais novidades da área. se é possível criar, através de computação gráfica, imagens de cenas tridimensionais, é também importante o estudo da criação das cenas a partir de imagens retiradas da mesma. neste âmbito, assumem particular relevância as técnicas de image based rendering e as recentes metodologias baseadas em light fields que permitem a criação de cenas a partir de múltiplas vistas de uma imagem. a motivação inicial para a realização deste trabalho resulta então desta crescente importância. a evolução, os avanços efectuados e trabalhos de investigação recentes vão na linha de utilização de imagens para a geração de novas imagens na ausência, total ou parcial, de descrição geométrica das cenas 3d correspondentes. a motivação para a realização deste trabalho deveu-se ao facto de a computação gráfica (cg) ser uma área em franco desenvolvimento, apelativa ao nível da interacção visual. a cg é também um desafio enquanto aplicação de conceitos matemáticos e como área didáctica para aplicação das novas tendências de aprendizagem utilizando a multimédia. o tema central do trabalho resulta então da confluência desta vertente matemática e da utilização de conhecimentos que envolvem educação multimédia. a junção das áreas de cg, matemática e educação multimédia, permitiu alcançar uma base de estudo sobre a qual foram definidos os objectivos deste trabalho no que diz respeito à divulgação da técnica de light fields. assim sendo, na próxima subsecção, são esclarecidos o objectivo geral e os objectivos mais específicos deste trabalho. 1.2 objectivos o objectivo deste trabalho consiste em analisar a importância que uma aplicação didáctica de light fields pode apresentar na compreensão desta técnica de image based rendering (ibr), por utilizadores com bons conhecimentos em informática mas com conhecimentos distintos na área da computação gráfica. capítulo 1: introdução 3 de modo a atingir o objectivo geral do trabalho, diversos objectivos mais específicos foram traçados, incluindo: efectuar um estudo teórico sobre a radiância e sobre técnicas de image based rendering, de modo a atingir as origens da técnica de light fields no contexto de ibr; estudar a técnica dos light fields com ênfase para a sua fundamentação teórica, mas, também, para a sua aplicação prática e incluindo outros trabalhos da área tais como os extended light fields; disponibilizar uma aplicação em ambiente windows que permita a visualização interactiva de light fields; construir um sítio web sobre light fields que, associado à aplicação gráfica windows, permita aos utilizadores obter uma rápida compreensão do, complicado, conceito de light field; realizar um estudo estatístico, baseado em resultados experimentais obtidos através de questionários, que comprove a utilidade da abordagem proposta. a utilização de uma aplicação para a construção de light fields com diferentes parâmetros permite manipular e transformar as cenas tridimensionais com diferentes resultados finais. ao objectivo inicial acrescentou-se a finalidade de percepção e compreensão de como os utilizadores analisam a complexidade dos conceitos. para se poder atingir este objectivo foi importante dar a conhecer a técnica para de seguida obter a resposta de diversos utilizadores com bons conhecimentos em informática e distintos conhecimentos na área da cg e da utilização de software de modelação gráfica e visualização gráfica. 1.3 estrutura da dissertação esta dissertação encontra-se estruturada em sete capítulos dos quais, o primeiro é composto por esta introdução ao trabalho. no segundo capítulo é apresentada a descrição do mundo real e como ele é visto do ponto de vista físico e matemático, de modo a ser possível aplicar pressupostos de simplificação para encontrar uma equação que permita compilar dados que traduzam as cenas reais ou virtuais. após mostrar a equação de radiância são dadas a conhecer as soluções apresentadas pela comunidade científica para esta equação. relativamente à visibilidade e iluminação são também apontadas descrições, enquanto factores de estudo, para aumentar a qualidade da cena. capítulo 1: introdução 4 no capítulo três encontram-se as representações para o processo de síntese realista de imagem em computador, sendo de especial realce os pressupostos de restrição do espaço de vista. por fim, são apresentados subcapítulos que descrevem a importância da amostragem e compressão, como processos fundamentais de estudo, para obter os melhores objectivos para a representação do mundo real ou virtual, bem como permitir que seja reduzido o espaço necessário em suporte informático. no capítulo quatro, considerado fundamental para o entendimento da técnica de light fields, é dada a definição e representação do conceito de light field, sendo que são apresentados complementos teóricos sobre a geometria e representações do mesmo. no fim do capítulo são apresentados os desenvolvimentos mais recentes e que estão a ser utilizados, bem como as linhas de investigação futuras. no quinto capítulo encontra-se a descrição do projecto e a implementação da aplicação didáctica de light fields construída em ambiente windows. inicialmente é descrita a metodologia genérica seguida para o desenvolvimento da aplicação. em seguida são descritas as plataformas de desenvolvimento seleccionadas, o sistema desenvolvido, os resultados obtidos e a manipulação das interfaces gráficas das aplicações desenvolvidas. no capítulo seis está descrita a investigação estatística efectuada a partir da realização de um questionário a utilizadores da aplicação didáctica desenvolvida. são apresentados, inicialmente, os conceitos básicos sobre o modo de elaboração e condução desta investigação a partir de questionários, sendo apresentadas em seguida as inferências que podem ser concluídas através da utilização dos dados obtidos. o último capítulo contém as conclusões gerais do trabalho, analisa os seus principais resultados, e apresenta algumas perspectivas de desenvolvimentos futuros. capítulo 2 2. equação de radiância em termos computacionais, uma cena tridimensional é vulgarmente uma estrutura de dados que representa um conjunto de objectos, em que cada objecto poderá ser uma malha poligonal (ou um conjunto de superfícies curvas, em algumas situações) e cada polígono será composto por uma sequência de pontos num plano. contudo, o “mundo real” é algo que gera, reflecte e transporta energia. assim, o estudo que se tem vindo a desenvolver para entender o comportamento da luz, como esta interage com as superfícies e se propaga, bem como as características de percepção, têm sido objectivos da computação gráfica, nomeadamente na área de síntese de imagem. a criação de imagens através da avaliação de um modelo de propagação de luz é vulgarmente conhecida por síntese de imagem, onde o fim a ser atingido é, usualmente, fotorealismo. um dos problemas consiste em simular a iluminação das cenas de modo que o processo de computação não seja moroso e que as imagens 2d projectadas sejam próximas da realidade. de facto, pretende-se que o processo seja rápido e, para além disso, em tempo real especialmente em situações de walkthrough em ambientes virtuais. as imagens tiradas das cenas devem ser produzidas tão rapidamente como é o olhar sobre o ambiente, com o objectivo de o observador experimentar a sensação visual como se estivesse na cena real correspondente. idealmente, a simulação da iluminação deverá ser tão precisa, e a velocidade da computação tão elevada, que não seja possível distinguir o real do virtual. o problema ainda toma maiores proporções quando os objectos da cena se movem e em situações em que a luz e o efeito que esta produz nos mesmos objectos é alterada. neste capítulo é efectuada uma abordagem à complexidade da luz, de como esta é descrita de um ponto de vista matemático e físico, como é caracterizada a reflexão da luz de uma superfície e como são formuladas as condições do equilíbrio do fluxo de luz num ambiente. o estudo apresentado é baseado essencialmente nos trabalhos de cohen [cohen et al., 1993] e slater [slater, 2000]. capítulo 2: equação de radiância 6 2.1 luz a complexidade do problema da representação da luz advém do difícil processo da sua interacção com os objectos. a luz visível é uma radiação electromagnética com comprimentos de onda no intervalo de 400nm e 700nm. na figura 1 pode ser visualizado o espectro electromagnético da radiação. figura 1: espectro electromagnético da radiação. a luz tem propriedades compatíveis com fenómenos ondulatórios e de partículas, ou seja, se é adoptado um modelo de onda de luz, e as experiências feitas tomam por base esse modelo, então, as conclusões tiradas são também compatíveis com a teoria de onda, sendo por outro lado, também válido para a teoria de partícula. as partículas são chamadas de fotões, pacotes de energia que viajam em linha recta no vácuo com velocidade c1 . os fotões também podem ser vistos como ondas. cada fotão carrega energia e que é proporcional à frequência de onda correspondente: e = h f (eq 1) onde h é a constante de planck2 e f a frequência da onda electromagnética, sendo esta inversamente proporcional ao comprimento de onda λ. de facto: λ f = c (eq 2) 1 símbolo usual para a velocidade da luz, aproximadamente 300 000 km por segundo. 2 constante de planck: h = 6,626 2*10-34 js, fundamental em física, usada para descrever quantitativamente o que se observa no espectro de radiação electromagnética. violeta azul verde laranja vermelho infravermelhoultravioleta 700 nm400 nm luz visível rádiomicroinfravermelhoultravioletaraios-xraios gama 10-6 10-4 10-2 10-1 1 101 102 104 106 108 1010 1012 capítulo 2: equação de radiância 7 os fotões têm outra propriedade particular: não interferem uns com os outros. assim, dois raios de luz que se cruzem não interagem um com o outro. por exemplo, fotões ao longo de caminhos, que chegam ao observador, não são afectados por outros que se cruzam à frente do seu ponto de vista. o problema de como a luz interage com as superfícies no espaço é um exemplo de um problema de transporte. em geral está associado com a distribuição do movimento de partículas num espaço. denota-se por φ a energia radiante ou fluxo num volume v. o fluxo é a razão da energia que flui através de uma superfície por unidade de tempo (que é medida em watts). a energia é proporcional ao fluxo de partículas, uma vez que cada fotão transporta energia. assim, o fluxo pode ser visto como o fluxo de fotões por unidade de tempo. de facto, a energia é variável com o comprimento de onda, de tal modo que, para especificar energia radiante num volume deve usar-se a notação φλ , isto é, a energia radiante de comprimento de onda λ. a partir de agora, no curso deste documento e em termos de notação o λ deixa de ser usado e só φ passa a relacionar-se com um comprimento de onda específico. considerando o fluxo total de um volume, este deve estar em equilíbrio dinâmico, ou seja, apesar do curso das partículas poder flutuar através do volume, a distribuição abrangente mantém-se constante (por exemplo, partes da cena não começam a ficar mais claras ou escuras de repente, mantendo outras o mesmo aspecto). para um observador, é fácil verificar que, imediatamente após um emissor de luz ser ligado numa cena, a energia da luz é distribuída instantaneamente através da mesma, e a iluminação mantém-se constante. este processo não é instantâneo mas aparenta ser, devido à grande velocidade da luz. em segundo lugar, a lei da conservação da energia aplica-se, pelo que, a energia total introduzida num volume deverá ser igual à energia total que é expelida e absorvida pela matéria no volume. a iluminação pode ser introduzida num volume de duas maneiras: pode viajar de fora para dentro (in-scattering) ou emitida de dentro do próprio volume (emission). a luz pode sair do volume através de streaming (através dele sem interacção com qualquer matéria) ou interagindo com a matéria no volume e depois ser reflectida (out-scattering) ou poderá ainda ser absorvido pela matéria (absorption) dos objectos ou meios participantes interiores ao volume [cohen et al., 1993] assim temos a seguinte equação que formaliza as transposições da energia: emission + in-scattering = streaming + out-scattering + absorption (eq 3) capítulo 2: equação de radiância 8 seja φ(p, ω) o fluxo no ponto p na direcção ω , onde p ∈ v o volume, e ω ∈ г o conjunto de direcções (onde ω é da forma (θ, φ)). cada um dos eventos na equação 3 é expressa em termos probabilísticos. por exemplo, a absorção (absorption) a(p, ω) é expressa como a probabilidade, por unidade de tempo de uma partícula no ponto p, ser absorvida, viajando na direcção ω, uma vez que o total absorvido neste ponto e direcção é a(p, ω) φ(p, ω). se for calculado o integral através do volume e direcções, a absorção total no volume é: ∫∫γ φ=φ v a dpdppa ωωω ),(),( (eq 4) de forma semelhante, seja k(p, ω, ω’) a probabilidade de um fotão que viaja através da direcção ω até ao ponto p ser reflectido na direcção ω’. assim sendo, o total de luz reflectida (out-scattering) é: ∫∫∫γ ω φ=φ v o dpddppk ωωωωω '),()',,( (eq 5) ( é o conjunto de todas as direcções na unidade de esfera). existe uma expressão semelhante para in-scattering, φi , mas com os papéis de ω e ω’ invertidos. o streaming é o fluxo total por toda a superfície, s, de v, em todas as direcções e pode ser determinado pelo seguinte integral. ∫∫γ φ=φ s s dpdp ωω),( (eq 6) por fim, a emissão (emission) é especificada como ε(p, ω), o fluxo emitido (energia de fotão, por unidade de tempo) no ponto p com direcção ω . assim, a emissão total num volume é: ∫∫γ =φ v e dpdp ωωε ),( (eq 7) face às definições anteriores, a equação 3 pode ser escrita como: φe + φi = φs + φo + φa (eq 8) de acordo com esta análise, se for conhecido o valor em qualquer ponto p e direcção ω, φ(p, ω), tem-se uma solução completa para o problema de iluminação em computação gráfica. dá a energia de luz que flui em qualquer direcção (г) e em qualquer ponto através de um volume de espaço (v). por exemplo, supondo a existência de um olho virtual ou câmara na cena com o objectivo de criar uma imagem, será então necessário encontrar todos os raios de luz que entram através da lente (isto é, um conjunto ω є ) e que chegam à retina ou ao filme fotográfico. estas lentes deveriam corresponder a um capítulo 2: equação de radiância 9 conjunto de pontos p e cada raio que atinge a superfície da lente carrega energia φ(p, ω) que determina a resposta do olho ou da câmara. uma imagem será formada na retina virtual ou no plano do “filme” que, visto por um indivíduo, gera a sensação associada à vista da cena virtual. para encontrar φ(p, ω), podia-se tentar resolver a equação 8, mas seria uma tarefa complicada. por esse motivo, tentam-se encontrar aproximações para a solução, dotadas do menor erro possível. o tipo de soluções varia consoante os requisitos iniciais: uma solução que transmite a sensação de real-time é totalmente diferente daquela que produz realismo de iluminação, sendo natural que se pretende um compromisso entre estes dois extremos. 2.2 pressupostos de simplificação de modo a obter aproximações da solução para a equação 8 alguns pressupostos são admitidos, nomeadamente a independência do comprimento de onda, o tempo invariante, o transporte de luz no espaço vazio e o facto de os objectos serem isotrópicos. 2.2.1 independência do comprimento de onda é usual assumir que não há interacções entre comprimentos de onda. por isso, a equação 8 pode ser resolvida através de uma amostra de diferentes comprimentos de onda, sendo estas soluções, posteriormente, combinadas em conjunto, dando uma estimativa da distribuição do comprimento de onda de um ponto ao longo de um raio, o que não considera o fenómeno de fluorescência (fluorescence) [foley et al., 1990]. este é o processo no qual o material absorve a luz num determinado comprimento de onda e reflecte num comprimento de onda diferente num período curto de tempo. 2.2.2 tempo invariante é assumido que qualquer solução para a equação de distribuição de energia continua válida com o tempo, a não ser que a geometria se altere na cena (por exemplo, um objecto que mude de posição). não se considera assim a fosforescência (phosphorescence) [foley et al. 1990] que ocorre quando a energia absorvida num determinado momento é emitida mais tarde com (relativo) largo tempo de atraso. capítulo 2: equação de radiância 10 2.2.3 transporte de luz em espaço livre uma aproximação também vulgar é considerar que o meio pelo o qual a luz viaja é o espaço livre, ou vácuo, em vez de um meio participante. assim sendo, o conjunto de elementos da equação simplifica-se: absorção e out-scattering apenas ocorrem na fronteira das superfícies; não há emissão excepto dos objectos; não há scattering ou absorption, excepto na superfície dos objectos. isto significa que um raio de luz que não seja obstruído (isto é, um raio entre dois objectos), não vê nenhuma da sua energia absorvida, ou dispersa (scattered) ao longo do raio e, portanto, não há partículas de matéria ao longo do raio que produzam energia adicional de luz. este pressuposto é razoável para cenas que representam interiores de edifícios, apesar de, mesmo nestes casos, o efeito do pó poder não ser considerado. é um pressuposto menos razoável para cenas de exterior, onde a chuva, o nevoeiro ou outro tipo de condicionalismos causados pela atmosfera produzem diferentes efeitos na luz. 2.2.4 objectos são isotrópicos quando os fotões atingem uma superfície, a sua energia pode ser parcialmente absorvida ou parcialmente reflectida. num material isotrópico, ao considerar-se uma direcção incidente da luz e uma direcção de reflexão, a relação entre as duas energias é a mesma em toda a superfície do objecto. este pressuposto simplifica o tipo de expressão envolvida no termo k(p, ω, ω’), uma vez que k é independente do p na superfície desse objecto. um material anisotrópico não possui esta propriedade que caracteriza as substâncias de possuirem as mesmas propriedades físicas independentemente da direcção considerada. 2.3 radiância anteriormente foi utilizado o termo fluxo, porque é mais fácil para a percepção do conceito: partículas que atravessam um volume (o número e a razão do fluxo destas partículas) e os efeitos das suas colisões com a matéria no volume. contudo, a quantidade real de interesse em computação gráfica não é propriamente o fluxo, mas uma quantidade derivada deste, chamada de radiância. radiância (l) é o fluxo que sai de uma superfície, por unidade de área projectada da superfície pela unidade de direcção de ângulo sólido [cohen et al., 1993]. seja da a área da superfície pela qual a energia sai em direcção θ em relação à normal a da, através de um diferencial ângulo sólido dω de acordo com a figura 2: capítulo 2: equação de radiância 11 figura 2: radiância como o fluxo por unidade de área projectada por unidade de ângulo sólido. assim sendo, se a radiância que sai da área diferencial da é l, então: ωθdldad cos2 =φ (eq 9) na expressão anterior, d2 φ relaciona-se com um raio de luz na direcção θ. outro modo de referenciar a radiância é l(p, ω), ou seja, é a função que é integrada ao longo do ângulo sólido e área projectada de modo a obter o poder radiante (fluxo) daquela área. na figura 3 são mostradas duas superfícies elementares, da e db. suponha-se r a distância entre elas, e l a radiância de da até db. considere-se ainda φ(da,db) o poder radiante transferido que pode então ser calculado da seguinte forma: φ(da,db) = ldacos θad ωa (eq 10) figura 3: fluxo entre duas superfícies elementares. todavia, utilizando a equação do ângulo sólido diferencial [cohen et al., 1993] vem: da db θa θb na nb da n dω θ capítulo 2: equação de radiância 12 2 cos r db d b a θ ω = (eq 11) de onde segue que: 2 coscos ),( r dblda dbda ba θθ =φ (eq 12) utilizando novamente a equação do ângulo sólido diferencial e simplificando-a, obtém- se: ),( cos cos cos),( 2 dadb dldb r da ldbdbda bb a b φ= = =φ ωθ θ θ (eq 13) esta equação mostra que a direcção do fluxo pode ser invertida, ou seja, o fenómeno de propagação da luz é reversível, seguindo o princípio geral de que as equações que envolvem energia de luz são invariantes quando as direcções são revertidas. a equação 12 mostra que o fluxo diminui com o inverso do quadrado da distância. por isso, quando as duas áreas são afastadas, o fluxo também diminui. contudo, não sucede o mesmo com a radiância: esta mantém-se constante ao longo de um raio, ou seja, é independente da distância da fonte. esta constatação leva a um princípio muito explorado em computação gráfica: muitas vezes, os fotões que atravessam um volume de espaço são esquecidos e, em vez disso e esquecendo a física por detrás destes conceitos, apenas se pensa nos raios que carregam energia de luz representada por radiância. em vários modelos, não se consideram os fotões e a energia que carregam, mas os raios e as radiâncias associadas. há mais três grandezas relacionadas com a energia luminosa que são importantes em computação gráfica. a primeira é conhecida como intensidade radiante: é o poder radiante (ou fluxo) por unidade de ângulo sólido (em estereoradianos). se i é a intensidade radiante, então o poder radiante associado é dado por: dφ = i dω (eq 14) comparando com a equação 10: i = l da cosθ (eq 15) onde l é a radiância correspondente. capítulo 2: equação de radiância 13 ωr ωi n θr θi p a segunda grandeza é denominada radiosidade: é o fluxo por unidade de área que radia da superfície, denotada por b. se b é a radiosidade associada à energia que sai da área da, então o fluxo pode ser recuperado através de: dφ = b da (eq 16) irradiância é o fluxo por unidade de área que chega à superfície. é usualmente denotada por e e, se a irradiância que chega a da é e, então o fluxo é: dφ = e da (eq 17) supondo que l(p, ω) é a radiância que chega ao ponto p ao longo da direcção ω, segue então da equação 9 que: ωθωω dpl da d pe cos),(),( = φ = (eq 18) 2.4 reflexão até aqui abordou-se a distribuição da energia da luz de uma cena e foram efectuadas breves referências sobre como a luz é absorvida e reflectida. em seguida é apresentada uma análise mais cuidada sobre o processo de reflexão. suponha-se que um raio de energia de luz atinge uma superfície num ponto p, com direcção incidente ωi. o volume sobre o qual essa energia pode ser reflectida é o hemisfério cuja base é o plano tangente no ponto p. realmente, este hemisfério contém todo o conjunto de direcções visíveis do ponto p que não são obstruídas pela superfície de que p faz parte. figura 4: direcção da reflexão caso a superfície seja especular. mas qual é a quantidade de energia que é reflectida numa qualquer direcção ωr? para responder a esta questão é introduzido o termo f(p, ωi, ωr) chamado bidirectional reflectance distribution function (brdf) que relaciona a radiância no ponto p, na capítulo 2: equação de radiância 14 direcção ωr, com a irradiância e incidente no ponto p segundo a direcção incidente ωi. assim, l(p, ωr) = f(p, ωi, ωr)e(p, ωi) (eq 19) especificações correctas de f(p, ωi, ωr) para superfícies do mundo real são tarefas difíceis, especialmente se a superfície é anisotrópica. em computação gráfica praticam- se, por vezes, abstracções longe do complexo mundo real e utilizam-se principalmente duas idealizações das propriedades dos materiais, chamadas de reflectores difusos e reflectores especulares e a mistura destes dois. um reflector especular puro corresponde a uma superfície tipo espelho, que reflecte o raio incidente completamente num só raio e com o ângulo de reflexão igual ao ângulo de incidência (ângulos medidos relativamente à normal da superfície no ponto p). além disso, os vectores que correspondem a ωi e a ωr estão sobre o mesmo plano que a normal como se pode observar na figura 4. por outro lado, um reflector difuso é uma superfície “rugosa”, que divide a energia do raio incidente em todas direcções de igual quantidade, ao longo de um hemisfério acima de p. na figura 5 é demonstrada a reflexão difusa numa superfície. figura 5: reflexão difusa: a luz radia num hemisfério à volta de um ponto da superfície. brdf’s mais complexas podem, no entanto, ser construídas. por exemplo, em cáusticas geradas por um objecto de vidro (reflexões do vidro), um raio incidente pode ver a sua energia dispersa num cone ao longo do raio especular reflectido ωr. um brdf é tipicamente construído como uma mistura das duas componentes: difusa e especular. tacitamente as superfícies são consideradas opacas. contudo, também existem superfícies transparentes que devem ser consideradas. a abordagem é semelhante, excepto que os raios de luz devem passar por diferentes meios (por exemplo do ar para dentro de um bloco de gelo), sendo que a direcção depende da densidade do material. capítulo 2: equação de radiância 15 2.5 equação de radiância o problema de iluminação em computação gráfica seria resolvido se fosse possível encontrar φ(p, ω) para todos os pontos e direcções, o que seria uma solução para a equação 8. de modo a simplificar a função e torná-la resolúvel, é introduzido um certo número de pressupostos restritivos e o de maior interesse é a utilização da radiância em vez do poder radiante, isto é, l(p, ω) em vez de φ(p, ω). com todos os pressupostos de simplificação e usando os termos até aqui definidos, é possível deduzir uma nova equação a partir da equação 8 que será de mais simples compreensão, sendo expressa em termos de radiância em vez de fluxo. é chamada de equação de radiância ou equação de rendering e fornece uma equação para a radiância no ponto p numa superfície ao longo do raio dado pela direcção ω. esta equação expressa o facto que a radiância deverá ser a soma de duas quantidades. a primeira é a quantidade de radiância emitida directamente neste ponto (por exemplo, o ponto pode estar numa superfície que é uma fonte de luz). a segunda corresponde a uma parcela de irradiância que é reflectida nesse ponto. a quantidade reflectida pode ser calculada como a soma de todos os raios que chegam a p (a irradiância total) multiplicada por brdf para esta superfície. assim: radiância = radiância emitida + total de radiância reflectida (eq 20) para qualquer direcção ωi a radiância reflectida, na direcção ω, é a irradiância multiplicada pela função brdf. usando as equações 18 e 19 vem: l(p, ωr) = f(p, ωi, ωr) l(p, ωi) cosθi d ωi (eq 21) se for calculado o integral ao longo do hemisfério de todas as direcções que chegam a p é obtido o total de radiância reflectida (trr): ∫ω = iiii dplpf ωθωωω cos),(),,(trr (eq 22) assim, das equações 20 e 22 de radiância tem-se que: φθθθωωωω ωθωωωωω π π ddplpfpl dplpfplpl iiiie iiiie sincos),(),,(),( cos),(),,(),(),( 2 0 2 0 ∫∫ ∫ += += ω (eq 23) onde le(p, ω) é a radiância emitida. capítulo 2: equação de radiância 16 suponha-se agora que p não está sobre uma superfície; então, uma vez que a radiância não muda ao longo de um raio em espaço livre, pode encontrar-se o ponto p fazendo o caminho inverso ao longo da direcção ω partindo dele até encontrar a superfície em p’. então l(p, ω) = l(p’, ω). a figura 6 mostra uma representação esquemática da equação de radiância. figura 6: ilustração da equação de radiância. considere-se qualquer raio que chega a p. de acordo com a equação 23, é necessário calcular a radiância ao longo deste raio. então é percorrido em sentido contrário da direcção ωi até encontrar outra superfície no ponto p’ e descobrir a radiância l(p’, ωi ). mas de modo a encontrar isto é necessário usar novamente a equação de radiância, ou seja, significa que está a ser aplicada a recursividade para determinar a radiância geral. em termos usuais, a equação da radiância transmite o facto de que a iluminação é globalmente determinada. a luz que se vê reflectida depende da luz, do material e da superfície em termos da sua brdf. 2.6 soluções da equação de radiância nas secções anteriores foi apresentada a dedução da equação de radiância e, tendo em conta que nas aplicações de computação gráfica, o principal interesse é que esta equação incorpore implicitamente todos os pontos de vista 2d, ou seja, imagens, que representam a cena, o problema será então como extrair a informação necessária para a construção destas imagens. o processo de extracção da equação de radiância para imagens projectadas 2d é chamado de síntese de imagem ou rendering. há duas grandes abordagens para realizar este processo: as soluções view-independent e as view-dependent. p p’ l(p,ω) e(p,ωi) ωi capítulo 2: equação de radiância 17 view-dependent significa que a equação de radiância é resolvida simplesmente para um conjunto de raios considerados necessários para a formação da imagem (conjunto de raios que entram no olho ou na lente da câmara). esta solução é chamada view- dependent porque, se a situação de visão se altera (por exemplo, se o olho muda de direcção), então todo processo de computação da radiância ao longo dos raios visíveis terá de ser efectuado novamente. deste modo, a solução view-dependent especializa-se em calcular l(p, ω) para o conjunto (p, ω), onde p está na superfície que representa a lente e ω corresponde à direcção dos raios que passam pela lente. uma solução view-independent concentra-se na pré-determinação de valores de l(p, ω) ao longo de todas as superfícies da cena e por todas as direcções possíveis. assim, para calcular uma determinada imagem, o conjunto de (p, ω) correspondente à superfície e direcções que passam pela lente, ou seja, os valores correspondentes de l(p, ω) são analisados em vez de serem calculados. esta abordagem é chamada view-independent porque a solução para l(p, ω) é encontrada sem se restringir a uma particular direcção de vista. possui a vantagem de que a produção de uma imagem de uma cena é uma operação constante, independente do tempo, da complexidade da cena e da vista particular. consome só o tempo de calcular as direcções e intersecções com a lente dos raios e de procurar os valores de l correspondentes. aproximações à solução da equação de radiância podem ser independentemente classificadas em mais duas formas, dependendo se é uma solução global ou local. uma solução local toma no máximo em consideração o efeito directo das fontes de luz nos objectos, e não toma em conta a reflexão entre objectos, o que elimina a recursividade da equação 23. nesta solução, o integral é substituído por um somatório sobre as direcções incidentes correspondentes aos raios que provêm somente das fontes de luz, cujos valores de radiância são conhecidos e que não têm de ser calculados recursivamente. as múltiplas reflexões de luz são aproximadas por uma componente de iluminação constante, designada por iluminação ambiente (garante iluminação de objectos sem luz directa). é ainda usual considerar as fontes de luz como pontos singulares de modo que, para cada ponto na superfície de um objecto, seja só um raio que representa uma radiância que chega de uma fonte específica de luz. de forma diversa, uma solução global considera a natureza recursiva da equação da radiância, pelo menos através de algum tipo de inter-reflexão entre objectos. o método denominado ray tracing [whitted, 1980] apenas considera a inter-reflexão entre objectos com superfícies especulares. o método chamado de radiosity considera apenas inter-reflexões entre objectos cuja superfície é difusa. outros métodos, usualmente conhecidos por monte carlo, utilizam métodos estatísticos de um vasto conjunto de direcções de raios e encontram uma solução global aproximada. capítulo 2: equação de radiância 18 2.6.1 flat-shaded graphics no método flat-shaded graphics a solução adoptada para a equação da radiância é simples sendo calculado um só valor de l(p, ω) que é replicado em todos os pontos ao longo da superfície. em modos práticos significa que cada objecto tem uma radiância pré-indexada (pode pensar-se em termos de cor). para qualquer ponto de vista os objectos são simplesmente projectados em 2d e visualizados nas suas cores. é view-independent, porque a solução é obtida sem ter em conta qualquer ponto de vista. é local, porque não há recursividade na solução sem impactos de pares de fontes de luz primárias, excepto nos termos em que cada objecto é tratado como uma fonte primária. 2.6.2 real-time graphics neste processo a equação de radiância é simplificada, sendo o elemento recursivo completamente removido. as fontes de luz são pontuais e só é incluída a iluminação directa, o que significa que o integral é substituído por uma soma unicamente sobre fontes de luz e, numa superfície, é simplesmente calculada a contribuição para cada luz até p (sendo uma solução local). esta abordagem difere do ray tracing, que será descrito a seguir, noutro sentido: no ray tracing os primeiros raios visíveis ao olho são procurados pela cena. em real-time graphics todos os objectos são “projectados” na superfície da lente – tornando-se assim em entidades 2d (raios não são utilizados explicitamente). neste espaço projectado 2d, os valores da radiância pré calculados nos vértices da superfície dos objectos são interpolados, para preencher as áreas sólidas visíveis dos objectos. ray tracing envolve a procura ao longo do caminho dos raios para os objectos que os raios intersectam, enquanto que real-time graphics o evita, projectando directamente os objectos para a superfície da lente. assim, não há cálculos computacionais intensivos de intersecção raio-objecto. é uma solução view- independent, porque as projecções do objecto são válidas para um particular ponto de vista e direcção. 2.6.3 ray tracing o algoritmo de ray tracing, proposto por turner whitted [whitted, 1980], baseia-se em colocar o observador por detrás de um ecrã transparente e lançar, a partir dos seus olhos, raios que irão intersectar os objectos tridimensionais. em seguida pinta-se o ponto do ecrã que foi atravessado pelo raio com a cor do objecto que foi atingido. capítulo 2: equação de radiância 19 whitted desenvolveu mais o algoritmo assim descrito, continuando o processo. quando o raio atinge a superfície da cena, pode gerar até três novos tipos de raios: de reflexão, de transmissão e de detecção de sombra. um raio que foi reflectido continua na direcção oposta ao ângulo de incidência numa superfície especular. é depois intersectado por objectos na cena e o objecto mais próximo que é intersectado será visto na reflexão. os raios que percorrem material transparente funcionam analogamente. saliente-se que o raio pode estar a entrar ou sair do material. para evitar o cálculo de todos os raios na cena, o raio de sombra é utilizado para testar se uma superfície é visível à fonte de luz. assim sendo, se a superfície estiver virada para uma fonte de luz, um raio é lançado desse ponto de intersecção para essa fonte de luz. se um objecto for encontrado antes da fonte de luz, a superfície está em sombra e, por isso, será iluminada somente com a intensidade de luz ambiente. figura 7: imagem gerada utilizando ray tracing. a equação de radiância é simplificada por apenas permitir fontes de luz pontuais. a memória da equação da radiância é tomada em consideração por, recursivamente, procurar o raio nas direcções reflectidas do ponto p até embater noutra superfície, e a radiância ao longo do raio é novamente calculada recursivamente. a recursividade continua até que toda a quantidade de radiância adicionada por um raio seja inferior a um valor pré-indexado. note-se que os caminhos de luz são procurados de trás para a frente, ou seja, do olho até à cena. por este motivo, no algoritmo, e dado que é view-dependent as soluções são encontradas para o conjunto específico de raios que entra no olho. é global porque a solução inclui uma forma especial do termo recursivo do integral. capítulo 2: equação de radiância 20 2.6.4 monte carlo path tracing é semelhante ao ray tracing, todavia, consegue produzir uma solução estimada para a equação da radiância que inclui reflexão especular e difusa. segue o mesmo princípio geral em que os raios primários são procurados dentro da cena desde o ponto de vista do observador. contudo, em vez de os raios recursivos seguirem caminhos específicos, determinados pela direcção para reflexão especular, os raios são gerados seguindo uma selecção aleatória. por isso, dada uma intersecção no ponto p de uma superfície, o brdf é amostrado para escolher aleatoriamente um novo raio que lhe dê seguimento por reflexão. isto será feito recursivamente até que sucessivas contribuições sejam negligenciáveis. é um método view-dependent, porque começa pelos raios primários visíveis ao observador e a solução só é válida para uma vista particular. é também um método de iluminação global, uma vez que é uma solução estocástica para a equação de radiância no total. na figura 8 é apresentada uma cena utilizando o método monte carlo path tracing em que se pode ver o efeito produzido pela iluminação directa. figura 8: imagem gerada utilizando monte carlo path tracing. 2.6.5 radiosity no método radiosity a solução adoptada para resolver a equação de radiância é reduzir a brdf a uma constante para todas as direcções de reflexão e eliminando todos os aspectos relacionados com a direcção na equação. o método também transforma a equação para ser re-expressa em termos de radiosidade em vez de radiância. de modo a responder à eliminação de todas as considerações relacionadas com a direcção, é assumido que todas as superfícies são reflectores difusos, ou seja, reflectem capítulo 2: equação de radiância 21 a energia do raio incidente por todas as direcções com igual energia, tornando a direcção irrelevante. como se pode observar na figura 9, o efeito visual da cena caracteriza-se por a sala estar iluminada de forma brilhante, as sombras no chão aparecerem esbatidas e efeitos subtis da luz estão presentes em toda a sala. é de salientar que a cor vermelha do chão produz um efeito avermelhado nas paredes que são pintadas de cinzento (efeito de mistura de cor ou color bleeding). o método pressupõe um valor constante de energia radiante por unidade de área, pelo que as superfícies da cena são divididas em pequenos elementos de superfície. a equação de radiância fica reduzida a um sistema de equações lineares (uma equação para cada pequeno elemento da superfície na cena) onde as incógnitas são as “radiosidades” associadas com os elementos da superfície. a solução para esta equação resulta, por isso, na radiosidade associada a cada pequeno elemento da superfície na cena ou, alternativamente, a pontos na fronteira desses elementos da superfície. figura 9: imagem gerada utilizando radiosity. é uma solução view-independent, porque é calculada em termos da cena, em vez de ser para qualquer conjunto particular de raios para um ponto de vista específico. é uma solução global, uma vez que não tem em consideração as inter-reflexões entre as superfícies difusas. uma vez feita a computação da radiosidade, é possível usar a abordagem de real-time graphics para produzir vistas específicas. 2.6.6 monte carlo photon tracing jensen [jensen, 1996] usou um método (monte carlo photon mapping) de dois passos na procura de raios de fontes de luz, combinado com o método usual de procura de raios para o ponto de vista. este método já tinha sido desenvolvido por shirley [shirley et al., capítulo 2: equação de radiância 22 1995] num método multi-stage que tinha a vantagem de produzir uma cena globalmente iluminada para um passeio em tempo real, que utilizava técnicas de estimação estatística de densidade. o método envolvia a produção de uma fina triangulação de todos os objectos (poligonais) da cena [shirley et al., 1995]. a partir das fontes de luz são procurados fotões com energia determinada pela distribuição de energia dos emissores e as intersecções com os objectos são seguidas por monte carlo based tracing até que as partículas sejam totalmente absorvidas. quando há um choque com uma superfície de um objecto, a informação é guardada no polígono correspondente. no fim do processo (que pode levar muitas horas para uma cena realista) todos os triângulos são arranjados na ordem dos objectos. cada triângulo tem potencialmente uma distribuição associada de choques de partículas que, em seguida, é utilizada para estimar a função de densidade de radiância ao longo desse caminho. finalmente, triângulos adjacentes que sejam suficientemente similares de acordo com o mesmo critério de tolerância são “colados” juntos (este último passo é feito para reduzir o número total de triângulos para a síntese de imagem ser mais rápida). a cena poderá ser então sintetizada em tempo real utilizando o método de iluminação suavizada por interpolação bilinear de gouraud [gouraud, 1971]. contudo, isto não é uma solução global para a iluminação e superfícies especulares e as reflexões não são correctamente tratadas nesta fase de síntese de imagem. 2.7 cálculo de visibilidade há um aspecto implícito, mas computacionalmente muito intensivo, da equação de radiância, que é o problema do cálculo de visibilidade. considerando um raio incidente numa superfície no ponto p, coloca-se o problema de conhecer a sua origem, ou seja, qual a superfície e o ponto concreto em que o raio tem início. ray tracing tem de explicitamente procurar intersecções do raio, potencialmente, com todos os objectos da cena (embora haja métodos para acelerar esta procura). este é um dos problemas de cálculo de visibilidade: está-se apenas interessado nos raios incidentes das superfícies que estão visíveis desde o ponto p (mesmo nestas situações podem surgir problemas computacionais, nomeadamente com objectos transparentes cujos raios poderão não ter um raio em linha recta de visibilidade até p, que ainda contribui para a energia de iluminação). o problema de visibilidade também ocorre em real-time graphics, embora não haja um ray tracing explícito. os objectos são projectados na superfície da lente, mas nem todos os objectos são visíveis ao observador, pelo que as relações de visibilidade entre objectos, relativamente a uma vista particular, devem ser tomadas em consideração. capítulo 2: equação de radiância 23 2.8 o problema de iluminação em image based rendering um paradigma diferente em síntese de imagem a discutir no capítulo 3, corresponde às técnicas usualmente designadas por image based rendering (ibr) onde não há praticamente um cálculo de iluminação. outros meios são, neste caso, utilizados para capturar uma amostra de imagens (sejam fotografias digitais ou outro sistema de síntese de imagem) com parâmetros de vista conhecidos. a essência desta abordagem é sintetizar novas imagens, de acordo com parâmetros de vista que não estejam no conjunto inicial desta amostragem. se as imagens originais forem capturadas por uma técnica que preserva a iluminação global (por exemplo, fotografias de uma cena real, desde que composta por reflectores difusos) então a técnica de ibr produzirá imagens “globalmente iluminadas”. o ponto essencial é que os cálculos de iluminação não são, por si só, parte do método de ibr, ou seja, não há nesta família de técnicas um cálculo explícito de iluminação, sendo esta inerente às próprias imagens iniciais. 2.9 sumário do capítulo o principal objectivo deste capítulo consistiu em mostrar como é possível encontrar uma equação que traduza a iluminação presente no mundo real e o modo de produzir soluções para que essa realidade seja expressa nas ferramentas computacionais. por conseguinte, foram apresentados conceitos sobre a luz e iluminação para, posteriormente, deduzir a equação de radiância que, contudo, não tem uma solução analítica. deste modo, foi também apresentada a investigação na área que passou por apresentar pressupostos de simplificação e algoritmos que maximizem a dualidade do tempo e qualidade de realismo para obter soluções aproximadas da equação de radiância. o estudo apresentado é importante para a completa compreensão dos conceitos de image based rendering e light fields que serão apresentados em detalhe nos próximos capítulos. capítulo 3 3. image based rendering síntese de imagem ou rendering consiste em gerar imagens realistas em computador. baseia-se num modelo computacional 3d que integra a geometria da cena, as características dos materiais dos objectos que se encontram na cena e as características da iluminação. há dois grandes paradigmas na geração ou síntese de imagens: geometry based rendering (gbr) significa síntese de imagens baseada em geometria; image based rendering (ibr) que explora e manipula imagens (fotográficas) que já contêm quase toda a informação da cena real, de modo a criá-la. quase todas as técnicas de representação de image based rendering derivam da plenoptic function, que é uma função com 7 dimensões e difícil de manipular. na figura 10 é apresentada uma descrição comparativa dos paradigmas de gbr e ibr. o objectivo da técnica de ibr é reproduzir correctamente uma cena num ponto de vista arbitrário, capturando um conjunto de imagens ou raios de luz no espaço, com limitada ou mesmo sem informação sobre a geometria da cena. se esta técnica for comparada com os modelos geométricos que dominam a síntese de imagem 3d tradicional, as imagens são mais fáceis de obter, simples de trabalhar e mais realistas. como o processamento de imagem é um tópico bastante estudado, o ibr tem atraído comunidades de investigadores. capítulo 3: image based rendering 25 figura 10: paradigmas gbr e ibr. sendo o objectivo de ibr, capturar e sintetizar as cenas 3d deve começar por analisar- se como é que o meio pode ser descrito. uma possibilidade é gravar todos os objectos que fazem parte dele e as suas interacções, também conhecida por descrição da fonte. o modelo tradicional de síntese de imagem adopta a seguinte descrição: as formas de certos objectos são representadas por certos modelos geométricos; as propriedades da superfície são descritas através de mapas de texturas e modelos de reflexão; a iluminação e as sombras são o resultado da interacção entre fontes de luz e objectos. a descrição da fonte é, normalmente, compacta e incisiva porque descreve como o mundo é composto. no entanto, existe a desvantagem de nem sempre essa descrição estar disponível. para se obter a descrição da fonte, daquilo que pode ser observado através de câmaras ou dos nossos olhos, não tem sido uma tarefa fácil de realizar, sendo esse um dos grandes objectivos a cumprir. 3.1 plenoptic function um método alternativo de explicar o mundo real é baseado na sua descrição aparente. a aparência do mundo pode ser analisada como um conjunto denso de raios de luz que preenchem o espaço, que pode ser observado através da posição dos olhos ou câmaras. este conjunto de luz pode ser representado através da plenoptic function, proposta por adelson e bergen [adelson e bergen, 1991]. construção do modelo geometria geometry based rendering mundo conceptual aquisição de imagem imagens image based rendering mundo real rendering desconectado análise de imagem visão das cenas capítulo 3: image based rendering 26 figura 11: sistema de coordenadas da localização espacial e direcção de vista. como mostra a figura 11, a plenoptic function é uma função de dimensão 7 que modela um ambiente dinâmico 3d, gravando os raios de luz em cada localização espacial (vx,vy,vz) por qualquer direcção possível (θ,φ) para qualquer intervalo de comprimento de onda (λ) e para qualquer instante (t), ou seja: p(7) = f(vx,vy,vz,θ, φ, λ, t) (eq 24) como foi descrito por adelson e bergen [adelson e bergen, 1991]: “o mundo é composto por objectos tridimensionais, mas esses objectos não comunicam as suas propriedades directamente ao observador. em vez disso, os objectos preenchem o espaço à volta deles com o padrão do conjunto de luz que constituem a plenoptic function, e o observador recebe amostras desta função. a plenoptic function serve de base de comunicação entre os objectos físicos e as imagens respectivas capturadas pela retina. é o intermediário entre o mundo e o olho.” quando se forma uma imagem numa câmara pinhole, a luz que passa pelo centro de projecção da câmara é capturada na parede oposta da caixa de câmara. os raios de luz também podem ser considerados como amostras da plenoptic function. como o processo de image based rendering é baseado em imagens, adopta uma descrição aparente. assim, é aqui definido ibr com base na plenoptic function como: dada uma função contínua plenoptic function que descreve a cena, image based rendering é um processo de duas fases – amostragem e síntese de imagem. na fase de amostragem, as amostras são retiradas da plenoptic function para representação e armazenamento. na fase de síntese de imagem, a função contínua plenoptic function é reconstruída com as amostras capturadas. um dos problemas em ibr é o número de dimensões da plenoptic function que dificulta o processo de síntese. realmente, a grande quantidade de dados necessária torna quase impossível amostrar toda a função numa só representação, pelo que a investigação feita em ibr tem tido como finalidade encontrar os melhores pressupostos para reduzir o capítulo 3: image based rendering 27 tamanho dos dados das amostras, mantendo uma qualidade razoável na fase de rendering. existem muitas representações na literatura sobre ibr [kang e shum, 2000]. estas representações seguem basicamente duas grandes estratégias para reduzir a quantidade de dados necessários. a primeira consiste em restringir o espaço de visualização do observador. esta limitação reduz efectivamente a dimensão da plenoptic function, o que facilita a amostragem e o rendering. a segunda estratégia consiste em introduzir fontes de descrição da cena como a sua geometria. uma vez determinada a representação de ibr, é possível reduzir ainda mais o tamanho dos dados através de amostragem e compressão. a análise de amostragem pode fornecer a informação do número mínimo de imagens (ou light rays) necessárias para sintetizar a cena com qualidade satisfatória. por outro lado, a compressão pode ainda remover a redundância dentro de uma imagem e entre imagens diferentes. devido à grande redundância em muitas das representações em ibr um bom algoritmo de compressão pode reduzir, substancialmente, o tamanho dos dados. nas secções seguintes são apresentados alguns pressupostos que podem ser aplicados para reduzir a quantidade de dados necessários para uma representação das cenas. 3.2 restrição do espaço de vista o espaço de vista pode ser limitado e a quantidade de imagens necessárias para reproduzir a cena pode ser amplamente reduzida. tome-se o exemplo extremo: se o observador fica numa determinada posição e observa numa determinada direcção, uma imagem ou uma sequência de vídeo capturada nessa posição e direcção é o suficiente para representar a cena. outro exemplo são os branch movies [chen, 1995], onde segmentos de filmes que correspondem a caminhos diferentes de navegação são interligados através de pontos branch e o utilizador é obrigado a mover-se ao longo de caminhos pré-definidos, podendo mudar o caminho nos pontos branch. 3.2.1 pressupostos para restringir o campo de vista há um conjunto de pressupostos que podem ser admitidos para restringir o espaço de vista em ibr. alguns são preferíveis, porque não interferem no modo como o observador experimenta a cena. outros têm o objectivo de reduzir o tamanho e tornam, por isso, a cena mais limitada. a lista das possibilidades de pressupostos é: 1. comprimento de onda; capítulo 3: image based rendering 28 2. radiância constante; 3. eliminação do tempo; 4. restrição aplicada ao movimento num plano; 5. restrição aplicada ao movimento num caminho; 6. observador numa posição fixa. em seguida estes pressupostos são descritos e desenvolvidos com maior detalhe. 3.2.1.1 comprimento de onda à medida que as imagens são tiradas para ibr, é possível simplificar a dimensão do comprimento de onda em três canais (ou seja, rgb - red, green e blue). cada canal representa a integração da plenoptic function sobre um determinado comprimento de onda. esta simplificação pode ser cumprida ao longo da captura e rendering de ibr sem grandes consequências na qualidade (quase todas as representações em ibr assumem este pressuposto). 3.2.1.2 radiância constante o ar é transparente e a radiância ao longo de um raio de luz no espaço vazio mantém-se constante. é implícito neste pressuposto que não é necessário medir a radiância de um raio de luz em diferentes posições ao longo do seu caminho, porque possuem o mesmo resultado. para se verificar a utilidade deste pressuposto, limitemos o interesse aos raios de luz que saem do convex hull de uma cena limitada. segundo este pressuposto, a plenoptic function pode ser representada pelos seus valores ao longo de uma superfície arbitrária envolvendo a cena, o que reduz mais uma dimensão à plenoptic function. a radiância de qualquer raio de luz no espaço pode ser sempre obtida por tracing back até à superfície seleccionada. por outras palavras, com este pressuposto é possível capturar a cena a partir de um ponto e sintetizá-lo em sítios diferentes. este pressuposto é muito utilizado [levoy e hanrahan, 1996] [gortler et al., 1996]. no entanto, uma câmara real tem uma resolução finita. um pixel, numa imagem, é a média dos raios de luz que atravessam a área correspondente na superfície da cena. se forem colocadas duas câmaras numa linha e capturado o raio de luz ao longo dela é possível haver resultados diferentes, uma vez que o tamanho observado da área da superfície da cena pode ser diferente. esta sensibilização de resolução foi estudada por [buehler et al., 2001]. 3.2.1.3 eliminação do tempo se a cena é estática, a dimensão tempo pode ser eliminada. apesar de uma cena dinâmica incluir mais informação do que uma cena estática, há preocupações práticas capítulo 3: image based rendering 29 que limitam a popularidade da sua representação via ibr. uma preocupação é o tamanho das amostras dos dados. se é capturada uma cena de vídeo, o tamanho tende a ser muito maior do que se fosse capturada uma simples imagem estática. da mesma forma é esperado que ibr dinâmico aumente na mesma ordem em relação ao ibr estático. ibr exige muitas vezes uma grande quantidade de câmaras para capturar uma cena. se o objectivo é capturar uma cena dinâmica, um conjunto de câmaras deverá estar presente a capturar vídeo ao mesmo tempo. o conjunto mais conhecido e que tem um considerável conjunto de câmaras é o de stanford light field vídeo câmara [wilburn, 2002], que consiste num conjunto de 128 câmaras, como se pode observar na figura 12. figura 12: conjunto de 128 câmaras construído para o projecto inicial stanford immersive television da universidade de stanford. contudo, ainda não será ainda suficiente para produzir um rendering de imagens com elevada qualidade. capturar imagens estáticas produz tantos problemas, porque existe a possibilidade de usar o eixo do tempo para compensar a falta de câmaras. isto significa que imagens capturadas em diferentes períodos de tempo e em diferentes posições podem ser utilizadas para sintetizar novos pontos de vista. 3.2.1.4 restrição aplicada ao movimento num plano se o observador, em vez de se movimentar no espaço 3d, ficar limitado a movimentar- se numa superfície, isto é num plano base, pode ser reduzida uma dimensão à plenoptic function, já que o local do observador se torna 2d. apesar de parecer que reduzir o ponto do observador a um plano é desagradável, este pressuposto é aceitável por duas razões: primeiro, o olho humano é menos sensível à paralaxe vertical e às mudanças de iluminação porque os dois olhos estão espaçados na horizontal. em segundo, o olho está capítulo 3: image based rendering 30 a um certo alto nível para caminhar nas aplicações. o exemplo das cenas usando mosaicos concêntricos [shum e he, 1999] mostra a possibilidade de produzir grandes efeitos 3d no movimento e na iluminação, tomando este pressuposto. 3.2.1.5 restrição aplicada ao movimento num caminho o observador só se move ao longo de um caminho, ou seja, o observador pode mover-se para a frente e para trás ao longo de um caminho, mas não poderá sair desse percurso. com este pressuposto consegue-se reduzir duas dimensões à plenoptic function (branch movies [chen, 1995] são um exemplo). este pressuposto é também razoável para aplicações de visita virtual, onde o observador segue um caminho pré-definido para ver uma cena maior. 3.2.1.6 observador numa posição fixa o pressuposto mais restritivo é o observador estar numa posição fixa o que consegue reduzir a dimensão da função plenoptic function a três variáveis. nenhum efeito 3d pode ser percebido aqui; contudo, a representação de ibr resulta bastante compacta e, apesar disso, apresenta muitas semelhanças com imagens e vídeos regulares. capturar dados e obter esta representação é também simples. atendendo a estes princípios a tecnologia de quicktime vrtm [chen, 1995], baseando-se neste pressuposto, tornou-se uma técnica de ibr bastante popular. 3.3 representações e o processo de rendering tomando os pressupostos mencionados anteriormente, a função 7d plenoptic function pode ser reduzida a funções de mais baixa dimensão. uma breve descrição das diversas técnicas será apresentada de seguida. 3.3.1 surface plenoptic function a função surface plenoptic function (spf) foi pela primeira vez introduzida por [zhang e chen, 2003]. trata-se de uma simplificação da função 7d plenoptic function, pela utilização do segundo pressuposto, descrito anteriormente. como já foi referido, a radiância mantém-se constante ao longo de um raio de luz no espaço vazio. a plenoptic function pode ser representada pelos seus valores em qualquer superfície que envolve a cena. para a superfície regular da cena com dimensão 2, a spf é uma função de dimensão 6: posição na superfície (2d), direcção do raio de luz (2d), tempo (1d) e comprimento de onda (1d). apesar da dificuldade de aplicação de spf na captura de cenas reais devido ao desconhecimento da geometria da cena, spf foi utilizada em capítulo 3: image based rendering 31 [zhang e chen, 2003] para analisar o espectro de fourier para a representação de ibr. a função surface light field [wood et al., 2000] pode ser considerada uma versão reduzida da spf, que atribui uma cor (rgb) a cada raio que tem origem na superfície de um objecto da cena. 3.3.2 plenoptic modeling e light field video ao ignorar a dimensão do comprimento de onda e a do tempo, mcmillan e bishop [mcmillan e bishop, 1997] introduziram a plenoptic modeling que é uma função de dimensão 5: p(5) = f(vx,vy,vz,θ, φ) (eq 25) no trabalho original apresentado por aqueles autores foi gravada uma cena estática posicionando câmaras no espaço de visão 3d, cada uma em cima de um tripé capaz de seguir a cena continuamente. em cada posição, uma imagem cilíndrica projectada foi composta através das imagens capturadas durante o movimento (panning). isto forma uma representação 5d de ibr: 3d para a posição da câmara e 2d para a imagem cilíndrica. para sintetizar um novo ponto de vista da representação 5d, o cilindro mais perto de imagens projectadas são levadas para a posição de vista baseada nas relações epipolares e alguns testes de visibilidade. a técnica light field video [wilburn, 2002] [yang et al., 2002] é uma outra representação 5d baseada nos pressupostos 1 e 2, sendo uma extensão dos 4d light fields. o light field video captura cenas dinâmicas usando um conjunto de câmaras. devido à restrição na utilização de hardware, o número de câmaras no conjunto é bastante limitado, 128 em [wilburn, 2002] e 64 em [yang et al., 2002]. por isso tornam- se visíveis os efeitos de aliasing3 e ghosting4 dos vídeos sintetizados. 3.3.3 light fields e lumigraph as representações de ibr 4d mais conhecidas são os light fields [levoy e hanrahan, 1996] e lumigraph [gortler, 1996]. ambas ignoram o comprimento de onda e o tempo e assumem que a radiância não muda ao longo de uma linha no espaço livre. apesar da parametrização do espaço de linhas orientadas ainda ser um problema, as soluções 3 aliasing um efeito do tipo serrilhado que implica que linhas diagonais não sejam perfeitas em virtude da divisão discreta em pixels de um monitor. 4 ghosting é uma distorção da imagem que foi amostrada fazendo que com imagens prévias ainda sejam visíveis em imagens posteriores. capítulo 3: image based rendering 32 apresentadas para ultrapassar esta dificuldade acabaram por ser a mesma: os raios de luz são gravados pelas suas intersecções com dois planos, um é indexado com coordenadas (u,v) e o outro com as coordenadas (s,t). figura 13: parametrização do light field. na figura 13 é mostrado um exemplo onde os dois planos (chamados plano de câmara e plano focal) são paralelos, sendo esta a forma de representação mais utilizada. um exemplo de light ray é mostrado na figura e indexado com (uo,vo,so,to). os dois planos são discretizados de tal modo que um número finito de light rays é gravado. se todos os pontos discretizados forem ligados do plano focal aos pontos do plano de câmara, é obtida uma imagem (conjunto 2d de raios de luz). portanto, a representação 4d é também um conjunto 2d de imagens. para criar uma nova vista do objecto, simplesmente é dividida a vista nos seus raios de luz, que são posteriormente calculados por interpolação quadrilinear por existir raios de luz na vizinhança do conjunto de imagem. objecto raio luz u v t s plano de câmara (uv) plano focal (st) (uo,vo,so,to) capítulo 3: image based rendering 33 figura 14: processo de discretização dos planos uv e st. por exemplo, na figura 14 o raio (uo,vo,so,to) é interpolado através de raios de luz que ligam os pontos discretos sólidos aos dois planos. a nova vista é então gerada por semelhança conjunta dos raios divididos. esta síntese de imagem pode ser feita em tempo real [sloan, 1997] [lensch, 1999] e é independente da complexidade da cena. 3.3.4 concentric mosaics para além dos pressupostos referidos para os light fields, os concentric mosaics restringem a câmara e o observador a mover-se num plano (pressuposto 4), o que reduz a dimensão da plenoptic function a três. com os concentric mosaics a cena é capturada através de uma câmara montada no fim de cada nível de célula, e capturam-se imagens em intervalos regulares à medida que a célula gira, como é mostrado na figura 15. figura 15: captura de concentric mosaic [shum e he, 1999]. u v s t (uo,vo,so,to) capítulo 3: image based rendering 34 os raios de luz são indexados pela posição de câmara ou pela rotação de célula por um ângulo α e pela localização do pixel (u,v): p(3) = f(α,u,v) (eq 26) esta parametrização é equivalente a ter muitas câmaras slit (disposição em régua) [shum e he, 1999] rodando com um centro comum e tirando imagens ao longo da direcção da tangente. cada câmara slit captura um mosaic manifold, dentro do qual os pixels podem ser indexados por (α,u), por isso o nome concentric mosaics. durante o rendering, o observador poderá mover-se livremente dentro do círculo de rendering com raio 2 sin fov r , onde r é o raio do caminho da câmara e fov é o campo de vista das câmaras. o rendering de concentric mosaics é baseado em slit. a nova vista é dividida em slits verticais. por cada slit, os slits vizinhos nas imagens capturadas são alocadas e usadas para interpolação. a vista sintetizada é parecida usando estes slits interpolados. há um problema associado aos concentric mosaics – a distorção vertical. infelizmente, e apesar de ser densa a captura de imagens no caminho de câmara, não é fácil eliminar a distorção vertical. no documento original de concentric mosaics [shum e he, 1999], foi introduzida uma correcção de profundidade para reduzir a distorção, baseada em algum conhecimento sobre a geometria da cena. apesar da distorção vertical, concentric mosaics ainda é um método bastante aliciante dada a sua simplicidade. outra representação 3d em ibr é o vídeo panorâmico [chen, 1995]. pode ser usado tanto para cenas dinâmicas (fixar o ponto de vista, pressupostos 1 e 6) como para cenas fixas (pressupostos 1, 3, e 5). se for comparado com sequências de vídeo regular, o campo de vista, o vídeo panorâmico é muitas vezes de 360º, o que possibilita o observador fazer zoom e movimentos (panning) interactivamente. se a cena é estática, o observador pode também rodar [chen, 1995]. capturar vídeo panorâmico é acessível. se for utilizado um sistema de multi-câmara [foote e kimber, 2000] ou uma câmara omnidireccional [nayar, 1997], ou uma câmara com lente olho de peixe, é fácil obter uma sequência de vídeo panorâmico. fazer o rendering deste tipo de vídeo envolve warping de imagens cilíndricas ou esféricas para imagens planares projectadas. devido à facilidade de captura e rendering, de uma qualidade perceptível e pelo requisito de armazenamento, multi-panoramas são adoptadas para diversos sistemas usados para capturar cenas em grande escala como em [kawasaki et al., 2001]. capítulo 3: image based rendering 35 3.3.5 image mosaicing image mosaicing compõe um simples mosaico com imagens múltiplas. o mosaico de saída é uma função 2d plenoptic function. muitas vezes este mosaico é composto com objectivos simples como aumentar o campo de vista da câmara, com aplicação em fotografias aéreas e animação [wood, 1997]. as técnicas de image mosaicing, dependendo da colecção de raios gravados no mosaico, podem ser classificadas em duas categorias: single-center-of-projection mosaic ou multiple-center-of-projection mosaic. na maior parte dos casos, os raios de luz gravados no mosaico partilham do mesmo centro de projecção (cop - center of projection), que são chamados de panoramic mosaic ou panorama. figura 16: exemplo de um panorama utilizando image mosaicing. os raios de luz estão indexados à sua direcção, ou seja: p(2) = f(θ,φ) (eq 27) apesar de ser fácil obter um panorama através de sistemas intensivos de hardware [nayar, 1997], o foco de estudo é como construir panoramas cilíndricos e esféricos colando múltiplas imagens [mcmillian et al., 1995]. usualmente, as imagens de input são capturadas do mesmo ponto de vista e estão relacionadas pela transformação projectiva 2d. se o conjunto de transformações for conhecido à posteriori, as imagens podem ser coladas facilmente. outras técnicas também foram desenvolvidas para obter estas transformações sem pontos específicos de correspondência [szeliski, 1994]. um assunto prático é que as imagens de input poderão não seguir uma partilha estrita com o mesmo cop, o que causa efeitos de ghosting no mosaico resultante. estes efeitos poderão ser eliminados através de algoritmos locais de alinhamento [szeliski e shum, 1997]. num cenário mais geral, as câmaras das imagens de input podem mover-se de uma maneira livre e o mosaico resultante ter cop múltiplos. em contraste com o mosaico panorâmico onde os raios de luz são indexados pelas suas direcções, os mosaicos cop capítulo 3: image based rendering 36 múltiplos indexam muitas vezes os raios de luz por uma certa superfície ou manifold, razão pela qual recebe o nome mosaico manifold. a direcção dos raios de luz é perpendicular ou tangencial à superfície do manifold. nos concentric mosaics a parametrização 3d é equivalente a ter muitas câmaras slit rodando à volta de um centro comum e capturando imagens ao longo da direcção tangencial. cada câmara slit captura um mosaico manifold, que pode ser indexado através de pontos numa superfície 2d cilíndrica (α,u). todos os raios de luz capturados são tangenciais a essa superfície. em [peleg, 1997], os mosaicos manifold são construídos através da colagem de imagens slit, assumindo que o movimento da câmara é lento. efectivamente, a superfície que é usada para a parametrização do raio de luz tem várias formas como planos, cilindros ou outras superfícies. se o centro de slits das imagens capturadas são usadas para a colagem, como foi sugerido em [peleg, 1997], os raios de luz serão aproximadamente perpendiculares a estes manifolds. um particular e interessante mosaico é construído quando a câmara faz o movimento para trás e para a frente. a projecção pipe foi usada para a construção do mosaico numa superfície pipe [peleg 2000]. a síntese de uma imagem mosaico é bastante simples. para o mosaico panorâmico é usual efectuar um warping de um cilindro ou de uma esfera mosaico projectado em imagens planares projectadas, como é feito no vídeo panorâmico. este warping é muitas vezes desconhecido num mosaico geral manifold. por isso as regiões do mosaico podem ser usadas directamente na síntese de imagem, desde que o campo de vista da imagem sintetizada seja suficientemente pequeno [wood, 1997]. note-se que em ambos os casos o movimento do observador é muito restrito. em mosaico panorâmico o observador só se pode mover ao longo de uma superfície/caminho fixado e através de uma direcção também fixa. é possível alargar esta restrição se forem capturados mosaicos múltiplos. o quicktime hopping [chen, 1995] e o manifold hopping [shum, 2002] são duas extensões dos mosaicos panorâmicos e mosaicos manifold, respectivamente. para além de aumentar o campo de vista da câmara, image mosaicing pode também ser utilizado para aumentar a resolução de imagem, a saber super-resolution [borman e stevenson, 1998]. 3.4 amostragem na secção anterior foram apresentados as várias representações de ibr e os seus esquemas de síntese de imagem, o que permitiu responder à questão de como amostrar e reconstruir a plenoptic function. contudo, a informação sobre a quantidade de amostras necessárias para que a reconstrução da função seja realizada minimizando os efeitos de aliasing, é também uma parte importante de estudo. assim sendo, são conhecidas várias respostas a este problema algumas das quais são a seguir enumeradas. capítulo 3: image based rendering 37 a amostragem de ibr é um problema difícil de resolver devido à elevada dimensão do sinal. a razão de amostragem é normalmente determinada em função da geometria da cena, da textura da superfície da cena, das propriedades da reflexão, do movimento dos objectos; da representação e da resolução da câmara de captura, entre outros condicionalismos. uma enorme quantidade de amostras era utilizada nos primeiros trabalhos conhecidos, uma vez que não havia solução para este problema. para reduzir a enorme quantidade de dados guardados devido à elevada amostragem, vários esquemas de compressão foram apresentados de modo a cumprir essa função. no início do ano 2000, foram publicados diversos artigos pioneiros nesta área [chai, 2000] [chan, 2003] [lin e shum., 2000]. como foi defendido em [chan, 2000], a amostragem é essencialmente um problema de processamento multi-dimensional de sinal. seguindo o teorema clássico de amostragem, primeiro deverá ser encontrada a transformada de fourier da plenoptic function e depois amostrá-la de acordo com a largura de banda do espectro. no entanto, apesar de na teoria ser possível encontrar a transformada de fourier da plenoptic function de dimensão 7, na prática é necessário reduzir a dimensão de sinal. baseado no pressuposto 1, a dimensão do comprimento de onda pode ser ignorado na maioria das aplicações de ibr. o pressuposto 2 considera que a radiância de um raio de luz ao longo do seu caminho se mantém constante no espaço vazio. na realidade, apesar da resolução das câmaras reais ser finita, o pressuposto poderá não ser estritamente válido [buehler, 2001], a amostragem ao longo do caminho do raio e a variação da radiância poderá ser, muitas vezes, lenta. pelo pressuposto 3, a dimensão tempo poderá ser ignorada. na prática, mesmo sendo capturada uma cena dinâmica, a amostragem no eixo do tempo é muitas vezes determinada pela razão da frame da câmara e pela propriedade da percepção temporal do sistema de visão [lin e shum, 2000]. devido a estas razões a maior parte do trabalho de ibr para compressão apresentado na literatura refere-se a light fields e concentric mosaics. 3.5 compressão apesar de, através de uma amostragem criteriosa se conseguir diminuir o número de imagens fonte em ibr, a quantidade de imagens necessárias ainda é elevada. para o espaço necessário de armazenamento em ibr ficar ainda mais reduzido, a solução será utilizar técnicas de compressão, justificando-se assim o recurso a técnicas de compressão de dados. a compressão em ibr é semelhante à utilizada em imagem e vídeo, porque ibr é normalmente capturado como uma sequência de imagens. no entanto, a compressão em capítulo 3: image based rendering 38 ibr tem também as suas particularidades. como foi mostrado em [shum, 2001], imagens em ibr apresentam boas correlações ao longo das frames por causa do movimento regular da câmara. por isso, é de esperar uma boa compressão em ibr. a compressão de imagens recorre muitas vezes a métodos destrutivos. no âmbito de ibr, isto traduz-se em distorções de informação às quais o sistema visual humano reage, sendo este, também, um tema de análise. uma vez que durante a síntese de imagem em ibr qualquer light ray capturado pode ser utilizado para interpolação, é desejável que o bitstream comprimido esteja acessível de modo aleatório, de modo que não seja necessário descomprimir todos os light rays em memória. esta propriedade também é importante para o streaming online dos dados de ibr. vector quantization (vq) é o primeiro recurso para a redução de tamanho de dados em ibr [levoy e hanrahan, 1996] [shum e he, 1999]. assume-se um método universal e fornece um rácio razoável de compressão, assim como uma rápida velocidade de descompressão. o comprimento do código do índice de vq tem tamanho fixo e é acessível de modo aleatório e tem aplicações potenciais em streaming online. por outro lado, vq não faz uso completo de correlações dentro e entre as imagens capturadas. os vários algoritmos podem também ser aplicados a imagens de ibr individuais sem alterações. foram utilizados em [miller et al., 1998] os algoritmos de dtc-based jpeg para a compressão de light fields [miller et al., 1998] e foi obtido uma taxa de compressão mais elevada do que para vq. os standards baseados em wavelets jpeg2000 [taubman e marcellin, 2001] melhoram ainda a performance e adicionam características como a escalabilidade. uma vez que a codificação de comprimento de variável (vlc-variable length coding) é empregue, a velocidade de acesso não é tão rápida como vq. no entanto, ainda é suficiente para o rendering para tempo real. a limitação é que a correlação inter frames não é utilizada, uma vez que o rácio é relativamente baixo. a maior parte dos métodos propostos [magnor et al., 2000b] [zhang e li, 2000] são próximos à codificação de vídeo, com certas modificações para as características específicas dos dados de ibr. as técnicas de codificação de vídeo básico incluem, entre outras: compensação de movimento (mc – movement compensation); a transformada discreta de cosseno (dct- discrete cosine transform); quantificação e vlc (variable length coding). as imagens são divididas em duas categorias: intra frames e inter frames. as intra frames são normalmente distribuídas uniformemente e codificadas independentemente, enquanto que inter frames são previstas através de intra frames vizinhas através de mc. um método bastante utilizado e exemplo deste tipo de aplicação é o standard de codificação de vídeo mpeg-2 [mitchell et al., 1996]. uma abordagem intuitiva para a capítulo 3: image based rendering 39 compressão de ibr é aplicar estes métodos directamente para a sequência de imagens de ibr. em [shum et al., 2000] foi proposta a compressão de concentric mosaics com mpeg-2. para facilitar o acesso aleatório foram construídos apontadores para o início das posições para cada grupo vertical de macro-blocos (mb) no bitstream. extensões directas desta abordagem foram utilizadas para vídeo panorâmico [shum et. al 2001 b] e para light fields dinâmicos simplificados [chan et al. 2003]. como o movimento das câmaras durante a captura em ibr é bastante regular torna-se mais eficaz aplicar métodos mais avançados para a compressão de ibr. em [zhang e li, 2000] foi proposto o reference block coder (rbc) que aplica um esquema mc em duas fases. o panning horizontal entre imagens capturadas vizinhas foi extraído em primeiro lugar como um vector de movimento de translação horizontal. refinamento local mc foi depois utilizado para reduzir o resíduo de mc. outra aplicação do rbc foi a utilização de cache durante o rendering o que garantiu o chamado just-in-time rendering. nos light fields, as câmaras estão dispostas num plano 2d. por isso a estrutura de mc deverá também ser 2d e as intra frames são distribuídos uniformemente no plano 2d. dada uma qualquer inter frame, quatro intra frames estão normalmente disponíveis e podem todas ser utilizadas para mc. mais desenvolvimentos na compensação de movimento incluem sprite based coding e model based coding. em [leung e chen, 2002] foi apresentado um método de compressão sprite based para concentric mosaics. um sprite é gerado através da colagem dos slits centrais de todas as imagens capturadas. de facto, o resultado é um cilindro panorâmico rugoso. o sprite é intra coded e todas as imagens capturadas são codificadas baseadas em previsões do sprite. este tipo de esquema tem boa acessibilidade. quando a geometria da cena está disponível consegue-se ganhar na previsão da imagem [magnor et al., 2000b]. uma estrutura de previsão hierárquica é adoptada, onde as imagens intra codificadas e a geometria do modelo são utilizadas em conjunto para prever as inter frames. em [magnor et al., 2000b] as imagens são mapeadas sobre o modelo de geometria como mapas de textura dependente. estes mapas de textura são depois codificados através de codecs 4d de wavelets. a codificação scalable vídeo e a codificação arbitrária de forma de objecto são duas componentes chave no standard de compressão de vídeo de mpeg-4. codificação scalable vídeo inclui scalability espacial, temporal e snr fine granularity scalability (fgs) e object-based scalability. ng propôs uma abordagem de scalability espacial para a compressão dos concentric mosaics em [ng, 2001]. utilizando uma reconstrução filter bank não linear, as imagens são decompostas em bandas de frequência diferentes e codificadas separadamente com o standard mpeg-2. se se estiver com online streaming, uma imagem de baixa resolução pode ser sintetizada enquanto que a base de banda de bitstream de compressão chega e pode ser refinada mais tarde quando mais capítulo 3: image based rendering 40 dados forem recebidos. escalabilidade temporal é aplicável a cenas dinâmicas para representação de ibr tais como vídeo de light fields ou vídeo panorâmico ou poderá ser considerado como escalabilidade ao longo de imagens diferentes. codificação de objectos arbitrários de vídeo modelado pode melhorar o desempenho de compressão, porque melhora a compensação de tempo, remove o fundo e evita a codificação da descontinuidade à volta da fronteira do objecto, o que foi adoptado na compressão de light fields [chang, 2003]. a codificação 3d de wavelet apresenta outra categoria de métodos para a codificação de vídeo [taubman e zakhor, 1994] [ohm, 1994] [tham et al., 1998]. a codificação por wavelet foi estendida à dimensão 4, para a compressão de light fields, tais como os apresentados em [peter e straber, 1999] [girod et al., 2003] [magnor et al, 2000a] [lalonde e fournier, 1999]. 3.6 sumário do capítulo neste capítulo foram descritas as mais conhecidas técnicas de ibr com ênfase nas técnicas surface plenoptic function, light field e lumigraph, concentric mosaics e image mosaicing. estas técnicas advêm originalmente da plenoptic function tendo sido aplicadas algumas simplificações para reduzir o número de variáveis que a compõem. a aplicação dos pressupostos de simplificação tornou possível o aparecimento destas novas respostas e metodologias de ibr. os processos de amostragem e compressão foram também brevemente referenciados, uma vez que o estudo dentro destes domínios e, apesar de não ser um dos objectivos deste trabalho, tomam contornos cada vez mais importantes na investigação científica em ibr. muitos outros métodos de amostragem existem no contexto de ibr, no entanto, a sua descrição detalhada ultrapassa o objectivo definido para este trabalho. no próximo capítulo será analisada em mais detalhe a técnica de light fields, envolvendo a sua definição, o tipo de geometria básica e as diferentes representações. capítulo 4 4. light fields no capítulo anterior foram descritas algumas técnicas de image based rendering que tentam solucionar a equação de radiância. levoy e hanrahan [levoy e hanrahan, 1996] e também gortler [gortler et al., 1996] providenciaram uma solução baseada em imagens para a equação de radiância sob um certo número de restrições. conforme visto na secção 2 a equação de radiância é uma expressão recursiva para a radiância l(p, ω), onde p é um ponto qualquer de uma superfície e ω é o conjunto de todas as direcções. qualquer conjunto p e ω específico formam um raio, uma vez que podemos pensar em l(p, ω) como o conjunto de todos os raios com origem nos pontos das superfícies. devido ao domínio de l, a dimensão do espaço do raio é cinco. contudo, a radiância é constante ao longo de uma dada direcção no espaço livre, ou seja, onde não há descontinuidades devido à intersecção com objectos ou intervenção de um meio participante. assim, a radiância é constante ao longo de cada direcção. um dos objectivos para a utilização da técnica dos light fields (lfs) foi permitir maior liberdade no intervalo de vistas possíveis. de facto, as técnicas anteriores ao image based rendering baseavam-se na utilização de mapas de ambiente para capturar a luminosidade proveniente de um mapa de texturas. a luz que incide num ponto e que é proveniente de todas as direcções é gravada na forma de um mapa de ambiente. a sua utilização original teve como objectivo primário a eficiente aproximação de reflexões de um ambiente numa superfície. no entanto, os mapas de ambiente também podem ser utilizados para rapidamente se reproduzir qualquer vista exterior do ambiente numa localização fixa, mas com uma orientação variável, sendo estes os fundamentos básicos do sistema apple quicktime vr [apple, 2007]. neste sistema, os mapas de ambiente são criados em localizações chave na cena e o utilizador pode mudar discretamente de orientação, sendo que a direcção de vista muda continuamente. a maior limitação dos sistemas de síntese de imagem que utilizam mapas de ambiente é o ponto de vista ser fixo, havendo, no entanto, alternativas baseadas na interpolação sobre a vista. a maioria destes sistemas requer valores de profundidade para cada pixel capítulo 4: light fields 42 no mapa de ambiente, o que facilmente é obtido se estes são imagens sintéticas. com o valor de profundidade é possível reprojectar pontos nos mapas de ambiente de diferentes imagens. o grande desafio da abordagem é “preencher os buracos” quando áreas prévias que estavam ocultas nas imagens fonte se tornam visíveis na imagem destino. num light field, representa-se a radiância como uma função de direcção e posição, em regiões de espaço livre de objectos que podem estar a ocultar a cena. assim, no espaço livre, o light field é uma função de dimensão 4 e cada imagem corresponde uma fatia de dimensão 2. criar um light field através de imagens corresponde a inserir fatias 2d numa representação 4d e, analogamente, gerar novas vistas corresponde a extrair e amostrar uma fatia. gerar uma nova imagem de um light field é diferente dos métodos de interpolação anteriores e baseia-se num conjunto de três passos. primeiro, uma nova imagem é geralmente formada através de diferentes pedaços das imagens originais, e não precisa de ser igual a qualquer uma delas. depois, informação do modelo é necessária para extrair valores da imagem, como valor de profundidade ou correspondências de imagens. finalmente, a geração de imagem envolve simplesmente amostragem, um processo linear simples. há grandes desafios na utilização de light fields para visualizar cenas 3d numa plataforma gráfica. primeiro, a decisão da parametrização e representação do light field, relacionada com a escolha do padrão de amostragem para o light field. em segundo, a aquisição e a geração do próprio light field. em terceiro, há o problema da rápida geração de diferentes vistas. isto requer que a representação da fatia para representar os raios através de um ponto deverá ser de fácil extracção, e que essa fatia seja amostrada rigorosamente para evitar problemas na imagem final. a óbvia desvantagem desta abordagem é a grande quantidade de dados que é necessária, mas que, devido à sua coerência, poderá ser bastante comprimida. 4.1 definição e representação do light field um light field é uma técnica de image based rendering que utiliza múltiplas vistas de uma cena para gerar novos pontos de vista. o processo consiste em capturar a luz que chega da cena num conjunto de dados, como já foi referido anteriormente. a condição de luz de uma cena pode ser caracterizada através da dimensão 5 da plenoptic function que descreve o fluxo de luz (radiância) em cada ponto no espaço de dimensão 3 (3 graus de liberdade) em qualquer direcção (2 graus de liberdade). assumindo um objecto limitado e um espaço envolvente transparente, a radiância não muda ao longo de uma capítulo 4: light fields 43 linha de vista. isto reduz o espaço de dimensão 5 a um espaço de dimensão 4. os raios que especificam a direcção do fluxo de luz são parametrizados pelas coordenadas da intersecção da linha com dois planos paralelos, plano de câmara e plano focal, sendo esta representação, a primeira a ser adoptada. um exemplo em dimensão 2 é mostrado na figura 17. figura 17: representação discreta de um light field (um light slab). por convenção, o sistema de coordenadas no plano de câmara é (u,v), no plano focal é (s,t). uma linha orientada é assim definida unindo um ponto no plano (u,v) a um ponto no plano (s,t). na prática, u, v, s e t foram restringidos a valores normalizados e os pontos em cada plano ficam restritos a um quadrilátero convexo. esta representação é conhecida por light slab. intuitivamente, um light slab representa um feixe de luz que entra num quadrilátero e sai por outro. esta representação permite colocar um dos planos no infinito, o que poderá ser conveniente uma vez que, assim, cada linha poderá ser parametrizada por um ponto e uma direcção. desta forma possibilita-se a construção de light fields a partir de imagens ortográficas ou de imagens com um campo de vista fixo. uma grande vantagem desta representação é a eficiência nos cálculos geométricos, envolvendo simplesmente álgebra linear. a estrutura dos planos (u,v) e (s,t) pode ser conseguida colocando o eixo óptico da câmara de forma perpendicular aos planos. o plano focal pode ser interpretado como o plano imagem da câmara, correspondendo (s,t) à posição do pixel. o 4-uplo (u,v,s,t) contem a informação da cor do pixel (s,t) na posição de vista (u,v). para obter uma plano câmara (u,v) planofocal (s,t) objecto capítulo 4: light fields 44 descrição completa que permita uma posição arbitrária do ponto de vista podem ser utilizados 6 pares de planos cada um alinhado num lado de um cubo. a estrutura assim definida denomina-se light field. o conceito de lumigraph apresentado por [gortler et al., 1996] é idêntico, apesar de conter mais informação, envolvendo alguma geometria da cena. o light field (de facto um subconjunto deste) é assim representado por l(u,v,s,t) e discretizado por todas as linhas possíveis entre os dois planos paralelos definidos por grelhas rectangulares impostas em cada plano. o plano (u,v) é subdividido em quadrados, onde cada vértice forma o centro de projecção efectuada sobre o plano (s,t). um light slab é formado a partir de dois planos, paralelos entre si, reticulados que servem para indexar com coordenadas (u,v,s,t) raios de luz que irradiam da cena. de modo a cobrir todas as possíveis direcções dos raios, são necessários seis light slabs. uma vez construído o light field, este pode ser utilizado para sintetizar uma imagem através de uma câmara virtual que não corresponde ao conjunto de câmaras no plano uv. uma nova imagem pode ser formada através da amostragem do conjunto de linhas provenientes do ponto de vista, nas direcções requeridas. a abordagem dos light fields foi projectada como um método para criar novas vistas de imagens de cenas reais, supondo que foram tiradas fotografias digitais sob condições restritas formando um conjunto de pontos de vista e direcções associadas com os planos uv. claramente este conjunto de imagens pode ser utilizado para criar um light field. 4.2 geometria básica e sistema de coordenadas a geometria básica dos planos de projecção, os objectos e as suas coordenadas podem ser visualizadas na figura 18. todos os objectos no espaço 3d x = [x y z]t são referenciados relativamente ao sistema de coordenadas que é localizado no meio do plano da câmara. ambos os planos, de câmara e focal, são paralelos ao plano (x,y) no sistema de coordenadas 3d (mundo). a distância entre os planos corresponde ao comprimento focal f. com esta representação, as coordenadas (u,v) e (s,t) do light field correspondem às coordenadas 3d (u,v,0) e (s,t, -f) respectivamente. o ponto do objecto x será projectado no ponto (s,t) no plano focal de acordo com as equações: s(u,v) = u-f x/z t(u,v) = v – f y/z (eq 28) capítulo 4: light fields 45 figura 18: sistema de coordenadas dos pontos nos planos uv e st. onde u e v descreve o centro de projecção da vista particular no plano (u,v). as coordenadas do mundo do plano focal (s,t) poderão ser transformadas em coordenadas do pixel (s,t) utilizando factores de escala sx e sy: s = sxs (eq 29) t = syt desta descrição advém o facto de ser possível fazer transformações lineares de coordenadas do sistema tridimensional para o sistema utilizando os planos de câmara e focal. 4.3 rendering: interpolação supondo que o plano uv é discretizado com uma grelha m*m, e o plano st com n*n, então o light field irá consistir de m2 imagens perspectivas, cada com uma resolução n2 (ilustrado em 2d, na figura 19). o ponto uv marca um centro de projecção e terá uma imagem associada com o volume de vista correspondente. todos os raios convergentes neste centro de projecção terão por isso uma radiância associada determinada por esta imagem que poderá ter sido capturada com uma câmara real colocada no ponto (u,v) ou, em casos de cenas virtuais, sintetizada com um centro de projecção (cop) colocado no mesmo ponto. o cop é mudado para cada ponto no plano (u,v) completando assim o light slab. todo o processo deverá ser repetido para cada um dos restantes light slabs, formando-se o light field. objecto • plano (u,v) (s,t) (0,0) • •• plano (s,t) z (u,v) (0,0) (0,0,s,t) (u,v,0,0) x capítulo 4: light fields 46 figura 19: uma imagem é criada para cada ponto no plano st. uma vez criado, o light field poderá ser utilizado para sintetizar imagens de câmaras virtuais com posições e orientações fora do convex hull da cena. figura 20: síntese de imagem para um novo ponto de vista. a figura 20 mostra os planos uv e st e uma possível posição e orientação da câmara virtual. cada raio proveniente da câmara virtual intersecta os planos st e uv. por exemplo, o raio r intersecta o plano st em (s0,t0) e o plano uv em (u0,v0). ao pixel da máquina virtual, correspondente ao raio r, será atribuído o valor de radiância l(u0,v0,s0,t0). por outras palavras, cada raio primário gerado pela câmara é utilizado para (u,v) (s,t) janela do plano de visualização no plano st (u,v) (s,t) r plano câmara centro de projecção (s0,t0) (u0,v0) capítulo 4: light fields 47 procurar o raio mais próximo no espaço 4d de raios correspondentes do light field, assumindo-se que as radiâncias têm o mesmo valor (propagação em espaço livre) este método pode ser implementado eficientemente utilizando técnicas de texture mapping. a figura 21 mostra um ponto (ui ,vj) da grelha no plano uv, e um quadrado contendo todos os pontos no plano que serão aproximados por este ponto particular. agora o quadrado projecta os pontos a,b,c,d no plano st. correspondendo a (ui ,vj) há uma imagem no plano st. esta imagem poderá ser usada como uma textura para sintetizar o quadrado uv para (ui ,vj), com as coordenadas de textura dadas por a,b,c,d. nesta abordagem o quadrado correspondendo a cada ponto da grelha uv é sintetizado utilizando um texture map da imagem correspondendo ao ponto da grelha. isto envolve a procura do conjunto de coordenadas de textura para cada quadrado, mas uma vez que os quadrados vizinhos partilham pontos grelha o número de projecções necessárias é aproximadamente o número de quadrados desenhados. é claro que nem todos os m2 quadrados serão sintetizados, dependendo do volume da vista da câmara. figura 21: utilização de texture mapping. na prática, a técnica simplista descrita irá conduzir, inevitavelmente, a um aliasing significativo. um esquema alternativo baseia-se na interpolação quadrilinear de radiância. há quatro vértices vizinhos do ponto no plano uv, e quatro vizinhos no plano st, como é mostrado na figura 22. considere-se em primeiro lugar a interpolação em u, com todos os outros parâmetros fixos; a equação 30 mostra, nestas condições, a expressão de u como uma combinação de u0 e u1. s t u (ui,vj) v a b d c • centro de projecção capítulo 4: light fields 48 figura 22: interpolação quadrilinear. 1 01 0 0 01 1 u uu uu u uu uu u − − + − − = (eq 30) ou, de outra forma, 1100 uuu αα += onde 110 =+αα (eq 31) a interpolação quadrilinear aplicada ao light field toma o pressuposto que a própria função l é uma transformação linear. assim, aplicando-se este princípio à equação 30, obtém-se: ),,,(),,,( ),,,(),,,(),,,( 0001100000 0001 01 0 0000 01 1 000 tsvultsvul tsvul uu uu tsvul uu uu tsvul αα += − − + − − = (eq 32) repetindo o argumento para cada parâmetro vem: ),,,(),,,( 1 0 1 0 1 0 1 0 lkji i j k l lkji tsvultsvul ∑∑∑∑= = = = = δγβα (eq 33) onde lkj δγβ ,, são definidos de forma semelhante a iα na equação 31, e correspondem a v, s e t respectivamente. agora todos os valores interpolados podem ser encontrados utilizando um método similar para encontrar coordenadas de textura interpoladas durante o processo de rendering dos quadrados uv e st como polígonos. gortler [gortler e al. 1996] mostrou que este método não pode ser implementado usando hardware de mapeamento de texturas. o suporte para interpolação quadrilinear em (ui,vj) expande-se fora até abcd na figura 23, e por isso a grelha de pontos vizinhos vai ter sobreposições. considerem-se os seis triângulos que contornam o ponto na grelha. gortler mostrou que sendo cada um destes triângulos sintetizado com texture mapping e utilizando alpha blending, com α=1 na grelha de pontos e α=0 nos restantes vértices do triângulo, equivale a efectuar interpolação linear em uv e interpolação bilinear em st [gortler et al. 1996]. portanto, sugere que os resultados não são visivelmente distinguíveis da interpolação bilinear total. s0 t0 •(u,v) u0 v0 v1 u1 t1 s1 (s,t) • capítulo 4: light fields 49 figura 23: o suporte para a base quadrilinear. gortler [gortler et al. 1996] mostraram ainda que, existindo alguma informação geométrica associada ao conjunto dos raios de light field, é possível um aperfeiçoamento da estimação da radiância. uma análise mais detalhada da rapidez do processo de rendering, em particular dados cruzando a qualidade de imagem e tempo de processamento, pode ser encontrada em [sloan, 1997]. 4.4 representações de light fields a representação apresentada, que recorre a dois planos paralelos (2pp), tem vantagens computacionais, especialmente relacionadas com o armazenamento (imagens rectangulares) e com a utilização de hardware de síntese de imagem para a reconstrução. contudo, não apresenta uma distribuição uniforme dos raios no espaço 4d. por outras palavras, se se pensar em raios arbitrários no espaço, nem todos os raios possuem o mesmo grau de aproximação de representação no espaço de light field. na prática, significa que a qualidade da imagem sintetizada é uma função do ponto de vista e da direcção de vista: pontos de vista próximos do centro do plano uv, e direcções ortogonais a este plano, resultam em melhores imagens. uma análise mais profunda da representação 2pp como um espaço 4d pode ser encontrada em [gu et al. 1997]. camahort e fussel, [camahort et al., 1999] apresentaram um estudo para três representações alternativas de light fields, a já conhecida 2pp, a representação através de duas esferas (2sp), e a representação através de uma direcção e um ponto (dpp). a representação 2sp envolve colocar uma esfera à volta de uma cena, e fazer a partição da esfera numa grelha uniforme. então todas as ligações entre todos os vértices na esfera formam a parametrização. a representação dpp recorre também a colocação de uma esfera à volta da cena. depois escolhe-se um ponto aleatório na superfície da esfera. isto define um vector desde a origem até esse ponto. a b cd (ui ,vj) capítulo 4: light fields 50 uma representação diferente de duas esferas foi introduzida em [ihm et al., 1997]. nesta representação era colocava uma esfera discretizada à volta da cena, mas com um processamento diferente, baseado na definição de direcções com base em discos orientados colocados no centro e os vértices da esfera. uma representação diferente baseada em duas esferas foi ainda introduzida em [ihm et al., 1997]; nesta representação é colocada uma esfera à volta da cena e um conjunto de esferas, mais pequenas, na superfície do objecto para representar direcções. figura 24: parametrizações do light field (à esquerda dois planos, no centro parametrização esférica e à direita representação através de um ponto e uma direcção). as conclusões de camahort e fussel [camahort et al., 1999], após uma análise aprofundada dos diferentes esquemas (bem como uma discussão de uniformidade), mostram que a abordagem direcção e ponto resulta em menos bias rendering e permite correcções que são mais simples de aplicar. na representação 2sp, há um número de assuntos práticos a considerar, tais como o local a colocar os planos uv e st. idealmente, a geometria da cena deverá estar o mais próxima possível do plano st. todavia, em termos práticos, significa que os light fields podem não representar, de forma adequada, cenas de profundidade significativa. uma distribuição de raios que seja adequada para representar superfícies próximas poderá não ser suficiente para representar superfícies afastadas. uma outra questão importante consiste em definir a resolução a atribuir para m e n. o último será mais relevante, uma vez que determina o grau de aproximação da geometria da cena (quanto maior for a resolução da cena no plano st, mais exacta é a sua representação). [levoy e hanrahan, 1996] ao sintetizar imagens com resoluções 256256 × , concluem que os valores n=256 e m=32 são suficientes. assumindo, por exemplo, que é essa a resolução utilizada, então um light slab constituir-se-á de 26 2 (= 256 x 256 x 32 x 32) raios. suponhamos que cada raio se dois planos esférica ponto e direcção capítulo 4: light fields 51 caracteriza por 3 bytes, então serão necessários 192 mb de memória para o light slab, e mais de 1 gb para o total light field (6 light slabs). note-se que isto é calculado para cenas estáticas e de relativa baixa resolução, tornando claro que um esquema de compressão é necessário. levoy e hanrahan [levoy e hanrahan, 1996] utilizaram, para o efeito, vector quantization [gesho e gray, 1992]. trata-se de um esquema de compressão onde os dados são partidos em clusters, cada um representado por um vector encontrado durante a fase de treino. cada vector corresponde a um codebook que guarda índices dos membros do cluster que representa. a descompressão é uma operação necessariamente rápida e, no caso, levoy e hanrahan mostraram rácios de compressão para além de 100:1 com actualização da imagem em real time ou com frame rate aceitável. com este tipo de taxas de compressão torna-se possível uma utilização prática da técnica dos light fields. 4.5 mais desenvolvimentos no estudo dos light fields desde as primeiras publicações, em 1996, das técnicas light field/lumigraph, que o interesse por esta teoria se tem mantido. em 1999, patrick ohly [patrick ohly, 1999] alargou o conceito e apresentou os extended light fields com aplicações em linux. os desenvolvimentos mais significativos foram orientados para problemas com cenas de profundidade pouco significativa. isaken [isaken et al., 2000] apresentou uma discussão de como ultrapassar este problema, adicionando efeitos de profundidades de campo e mostrando de como os lfs podem ser usados como base dos sistemas display de auto- stereoscopic. pela sua natureza, os light fields são mais apropriados para cenas estáticas, em detrimento de cenas interactivas. contudo, steiz [steiz et al., 1998] permitiu algum grau de interacção mostrando como era possível editar uma imagem de uma cena e propagar as mudanças a todas as outras imagens, mantendo a consistência do conjunto. um surface light field é um lf que consiste de raios que emanam das superfícies, em princípio o conjunto de raios que saem desse ponto com a sua radiância associada. [wood et al., 2000] mostrou como construir, editar e visualizar esse tipo de light fields para cenas reais. como afirmado anteriormente, a teoria de representação de light fields foi considerada em [camahort et al., 1999]. num outro estudo, chai, thong, chan e shum [chai et al., 2000] providenciaram uma análise completa de requisitos para a amostragem. incluía capítulo 4: light fields 52 uma curva de amostragem mínima que relacionava a complexidade da cena, a resolução do output e a amostragem da imagem. estudos mais recentes, nomeadamente, em 2006, [ahrenberg e magnor, 2006] apresentaram uma base de trabalho sobre light field rendering baseado em matrizes ópticas. foi apresentado um sistema de rendering em tempo real para light fields comprimidos e não comprimidos utilizando matrizes ópticas, ou seja, um conjunto de operadores relacionados com propagação de luz, lentes finas e dielectric interfaces. as dielectric interfaces podem ser representadas utilizando matrizes o que permite modelar um light field através de uma série arbitrária de operadores ópticos conduzindo transformações lineares nos seus elementos. num outro campo, os progressos continuam em matéria de recolha de imagens, como seja o protótipo de câmara de aquisição de light fields [liang et al., 2007] e, posteriormente, modificações sobre a técnica, nomeadamente o recente dispositivo interactivo de visualização de 360º light fields. o visualizador utiliza programação standard para sintetizar mais de 5000 imagens por segundo de gráficos 3d interactivos projectando vistas de 360º com 1,25º de separação até 20 actualizações por segundo. outras linhas de orientação de estudo têm sido seguidas, como sejam: a compressão [ramanathan, 2005], a aplicação à visualização de imagens [dansereau, 2003], e de fotografias digitais [ng, 2006], assim como novos métodos de manipulação e integração de lfs [chen, 2006]. 4.6 sumário do capítulo os conceitos associados aos light fields são pontos fulcrais deste trabalho. assim sendo, este capítulo pretendeu esclarecer o significado de light field, mostrar os primeiros passos dados para a sua aplicação, qual a componente matemática e teórica associada e apresentar as suas diferentes possibilidades de representação. o conceito de light field e a sua aplicação são, no entanto, complexos. como tal, no capítulo seguinte será analisado o projecto e implementação de uma aplicação didáctica simples de light fields que permita compreender melhor o conceito a utilizadores com distintos graus de conhecimento na área da computação gráfica. capítulo 5 5. aplicação didáctica de light fields de modo a permitir uma fácil compreensão do conceito de light fields, foi desenvolvida uma aplicação didáctica composta por um sítio web e uma aplicação de visualização em ambiente windows para computadores pessoais. o sítio web contém uma descrição detalhada das componentes teóricas e procedimentos desde os conceitos necessários até à criação dos light fields. a aplicação windows permite uma visualização interactiva de lfs previamente construídos, complementando deste modo o sítio web, na aprendizagem do conceito. inicialmente, foi utilizado um pacote de software de construção de light fields [levoy, 1996] executável em sistema linux ou sgi (silicon graphics, inc.) [sgi, 2007], que serviu de base ao trabalho. este pacote permite a geração de light fields com distintas parametrizações, possibilitando deste modo a obtenção de dados para a aplicação de visualização desenvolvida. neste capítulo descreve-se a base de trabalho utilizada, referindo o início do projecto, as actualizações elaboradas e utilizadas de modo a ser possível efectuar a geração de lfs adequados à realização do estudo e análise dos resultados obtidos. descreve-se também a arquitectura, potencialidades e desenvolvimento da aplicação windows de visualização de lfs e o modo de criação do sítio web que permitiram a realização do estudo estatístico que será apresentado no capítulo seis. ao elaborar a aplicação didáctica houve necessidade de contextualizá-la perante os modelos educacionais existentes na literatura. foi também necessário responder à questão de como escolher uma ferramenta de gestão de conteúdos de acordo com o modelo de aprendizagem seleccionado. assim sendo, no início deste capítulo são apresentados e descritos os modelos pelo quais os indivíduos se regem para utilizar e obter novos conhecimentos e justificado o modelo educacional seleccionado para o trabalho. capítulo 5: aplicação didáctica de light fields 54 5.1 modelos educacionais um modelo pode ser definido como uma representação ou interpretação simplificada da realidade ou uma interpretação de uma parte de um sistema, ideia, evento, objecto ou processo, segundo uma determinada estrutura de conceitos mentais ou experimentais. normalmente, para estudar um determinado fenómeno complexo, podem-se criar diversos modelos com diferentes características. um modelo educacional apresenta uma representação simplificada de um processo ou sistema educacional analisando-o segundo uma dada construção de conceitos mentais ou experimentais. todos os indivíduos constroem modelos com conhecimentos prévios e com o objectivo de acomodar a nova informação podendo assim ser compreendida a importância da utilização de modelos no processo de ensino-aprendizagem [gomes et al., 2006]. os modelos educacionais podem ser classificados em quatro tipos [gomes et al., 2006] [gilbert e boulter, 1998]: • modelo mental – representação pessoal e privada de um objecto; • modelo expresso – versão do modelo mental que é expressa por um indivíduo através da acção, da fala ou da escrita; • modelo consensual – modelo expresso que foi submetido a testes pelo grupo social, por exemplo, pertencente à comunidade científica e sobre o qual se concorda que apresenta algum mérito; • modelo pedagógico – modelo especialmente construído e utilizado para auxiliar na compreensão de um modelo consensual. em relação a este último tipo de modelo inserem-se os três modelos a seguir descritos [baumgartner e hafele, 2005]: • transferência de conhecimento: neste modelo, a origem do conhecimento do aluno baseia-se no conhecimento do professor. o professor compreendendo que os alunos precisam de aprender, centra a sua tarefa em transferir este conhecimento ao aluno da forma mais simples. o conhecimento transferido é extraído do professor, com preparação didáctica, para que os alunos possam não só absorver o conteúdo rapidamente, mas também memorizá-lo a longo prazo. este modelo tem algumas semelhanças com o behaviorismo [fosnot, 2000]; • aquisição, compilação e acumulação de conhecimento: este modelo pressupõe que a aprendizagem é um processo activo, em que o aluno tem de planear, rever e reflectir. o papel dos alunos é neste caso activo sendo esta uma condição necessária deste processo. no ensino de transferência de conhecimento, o professor não está interessado em controlar ou observar o capítulo 5: aplicação didáctica de light fields 55 processo de aprendizagem em si mas sim nos resultados finais do processo. pelo contrário, neste tipo de ensino, o processo, os seus passos intermédios, as dificuldades e resultados são monitorizados pelo professor. os alunos não recebem do professor uma resposta positiva ou negativa, mas sim o professor tenta ajudar o aluno a superar hipóteses erradas ou atitudes erradas de aprendizagem e a melhorar o processo de reflexão e aquisição do modelo mental do tema. este ensino assemelha-se ao cognitivismo [fosnot, 2000]; • desenvolvimento, criação e construção de conhecimento: no modelo do ensino anterior, todos os problemas e tarefas são apresentados pelo professor. mas neste modo de ensino é necessário criar ao alunos um ambiente de aprendizagem especial e estimulante no qual os métodos tradicionais não funcionam. no modelo de ensino de desenvolvimento, criação e construção do conhecimento, tanto o professor como o aluno colocam-se numa situação de aprendizagem cujos resultados não são anteriormente determinados. ambos têm de dominar a situação presente e as óbvias diferença professor/aluno, em que o primeiro possui mais experiência e conhecimento e está melhor preparado para reflectir sobre situações complexas (por exemplo conceber experiências). este tipo de ensino está intimamente ligado ao construtivismo [glasersfeld, 1996]. perante estes tipos de modelos deve acrescentar-se a utilização de ferramentas cada vez mais poderosas e que estão mais facilitadas para a sua obtenção e utilização. o advento da multimédia no ensino veio complementar os modelos educacionais já existentes e criar novos paradigmas. no habitual processo de instrução, igualmente aproveitadas pela instrução multimédia, podemos encontrar as seguintes tarefas [faria et al., 2003]: • análise da tarefa; • envolvimento e participação activa do aluno; • tempo de aprendizagem individual. neste processo, o aluno é incentivado à memorização da informação e aplicação de habilidades/capacidades na resolução de problemas. o método falha essencialmente ao não criar no aluno relações de compreensão. neste contexto é importante referir as conclusões da psicologia cognitiva relativas ao conceito de integração de conhecimentos como processamento da informação e aquisição de conhecimentos, e do construtivismo [fosnot, 2000] referentes à noção que o conhecimento não pode ser lançado sobre o aluno, apenas integrado por ele na sua reconstrução mental face à nova informação. o processo de aprender liberta-se cada vez mais da ideia de recepção passiva de conhecimentos. cada vez mais a aprendizagem é caracterizada por um processo activo, no qual o indivíduo integra a nova informação na capítulo 5: aplicação didáctica de light fields 56 sua rede semântica, reestruturando nesse processo os seus modelos mentais e cognitivos. em resumo, desloca-se o ênfase do “saber que” (conhecimento declarativo) para o “saber como” (conhecimento de procedimentos) e “saber por quê” (conhecimento contextual). neste novo paradigma, são reforçadas sobretudo duas formas de conhecimento: o conhecimento científico da aprendizagem (e as ciências relacionadas) e o conhecimento prático baseado no ensinar, no oposto da investigação científica formal. o ensino multimédia caracteriza-se pela utilização de uma série de ferramentas que visam o desenvolvimento do processo de criação de conhecimento e formação do indivíduo, nomeadamente através da exploração das suas capacidades mentais e da sua estrutura cognitiva. este ensino, essencialmente colaborativo e responsabilizador (tanto na auto avaliação como na avaliação partilhada), aposta na participação activa do indivíduo, na flexibilidade do seu modelo, na óbvia utilização de suportes tecnológicos, e no desenvolvimento de capacidades de comunicação interpessoal. as suas principais áreas de intervenção vão além da exposição de informação (como objecto principal do método de ensino) e dos suplementos informativos (como mero suporte ao método de ensino). a multimédia alberga em si a possibilidade do estudo independente (e consequente formação individual) e da investigação (devido à partilha e armazenamento da informação). a outra grande inovação do ensino multimédia deriva da introdução de um novo modelo temporal e espacial: o indivíduo interage agora com a informação sem necessidade de uma presença física e espacial fixa e pré-determinada. a preocupação pela didáctica tem uma longa tradição e foram desenvolvidas várias perspectivas e definições de educação/instrução [faria et al., 2003] [issing, 1994] [issing, 2003]. uma definição típica consiste na didáctica como teoria de conteúdos educacionais [klafki, 1974]. a didáctica como teoria e prática de ensino e aprendizagem é outra definição apresentada por [jank e meyer, 1994]. a didáctica pode ser também definida como aplicação de teorias psicológicas de aprendizagem ao planeamento, desenvolvimento, condução e avaliação sistemática do processo de aprendizagem. a didáctica multimédia é concebida como uma subdivisão da didáctica geral com ênfase especial no uso integrativo de multimédia no ensino e aprendizagem. adere, no entanto, a muitos conceitos da tecnologia instrutiva utilizados ainda hoje na elaboração de instrução baseada em computador (computer based training - cbt). não é o ensino o centro de interesse, mas a aprendizagem. o processo de aprendizagem já não pode ser entendido como recepção mais ou menos passiva de informação, mas como uma aquisição activa de conhecimento pelo estudante, integrando a informação capítulo 5: aplicação didáctica de light fields 57 nova na sua rede semântica, elaborando e reestruturando os seus modelos mentais e estruturas cognitivas [kozma, 1991]. como referido, anteriormente os objectivos de aprendizagem são hoje colocados mais frequentemente no domínio de conhecimento de procedimentos (saber como) e de conhecimento contextual (saber por quê, quando e onde) do que no até agora enfatizado domínio de conhecimento declarativo (saber que) [tennyson e nielsen, 1998]. isto significa que a ênfase mudou definitivamente do conhecimento de factos para a aquisição de habilidades e estratégias cognitivas e, como tal, os processos de aprendizagem multimédia devem seguir esta tendência. 5.2 interactividade e visualização o ensino multimédia baseia-se na interactividade e na visualização como conceitos chave para produzir o desejado efeito de conhecimento e compreensão no indivíduo, privilegiando a aprendizagem interactiva individualizada. hammond distingue três dimensões do processo educativo que envolve a interactividade [hammond, 1993]: • controlo: o nível ou grau de exposição da informação pelo sistema ao indivíduo; • envolvimento: extensão da participação do indivíduo no processo de aprendizagem (participação activa e não passiva); • síntese: capacidade do indivíduo de produzir conhecimentos a partir da informação disponibilizada (aprender com interacções da troca de informação e não com o memorizar dessas informações). na figura 25 é apresentada de forma esquemática a interligação das dimensões e o grau de associação entre o controlo, envolvimento e síntese. capítulo 5: aplicação didáctica de light fields 58 figura 25: grau do controlo, síntese e envolvimento de conhecimento em aprendizagem baseada na utilização do computador (adaptado de [hammond, 1993]). no que respeita à visualização, o ensino multimédia baseia-se em vários suportes, privilegiando o uso da visualização e das técnicas de apresentação da informação. esta visualização serve dois grandes objectivos: apresentar ao indivíduo experiências cuja realidade física ou temporal lhe é impossível de experimentar, ou cujo tamanho físico lhe seria demasiado pequeno ou grande para percepcionar; permitir a percepção física de objectos e conceitos abstractos, como teorias, e modelos. sendo a percepção visual a que produz mais efeitos sobre a motivação do indivíduo, além de estimular a imaginação deste, desencadeia o processo cognitivo que o indivíduo necessita para a criação de conhecimento, superando as deficiências cognitivas que possa ter numa qualquer tarefa particular que tenha em mãos. como é abordado na psicologia da aprendizagem, toda a informação apresentada no modo pictórico é assimilada de forma mais imediata pelo indivíduo. por outro lado, a conjugação de texto e imagem produz os efeitos mais concretos e fáceis de activar na memória e aplicar na realidade, motivo pelo qual a relação entre os dois deverá ser a mais adequada à realidade que se pretende ensinar. 5.3 modelo da aplicação a aplicação multimédia, desenvolvida no âmbito deste trabalho foi construída de modo a conter um vasto conjunto de potencialidades didácticas que permitam uma simples compreensão do conceito de light field. esta aplicação insere-se no modelo educacional, mais especificamente partilha métodos descritos no modelo de professor/sistema apresentação criação controlo activo aluno síntese envolvimento passivo capítulo 5: aplicação didáctica de light fields 59 desenvolvimento, criação e construção de conhecimento e de aquisição, compilação e acumulação de conhecimento. o aluno é um elemento activo no processo, tendo acesso aos conceitos ligeiramente encaminhados pelo professor que faz o levantamento das dificuldades ao longo da aprendizagem. também é providenciada uma aplicação, não só por si estanque de conceitos, sendo dada a liberdade para ser explorada pelo aluno, no contexto do seu processo de aquisição de conhecimento. assim sendo, o aluno é um elemento activo, porque tem de procurar e envolver-se no estudo. o professor efectua a análise das respostas às perguntas que foram apresentadas de forma estruturada até atingir o conhecimento final. a disponibilização do sítio web com os conceitos base, associada à aplicação didáctica, possibilita classificar o controlo simultaneamente da responsabilidade do professor/sistema e do aluno. finalmente, em relação à capacidade do indivíduo produzir e adquirir conhecimentos a partir da informação disponibilizada deverá ser, manifestamente, de criação. desta forma, relativamente ao modo de visualização, o objectivo consistiu num posicionamento no cubo de hammond no ponto assinalado na figura 26. figura 26: nível de controlo, síntese e envolvimento do utilizador. este posicionamento, perto do canto inferior direito com ligeira profundidade na parte frontal do cubo de hammond, define um processo educativo com um envolvimento manifestamente activo, controlo do processo dado maioritariamente ao aluno e síntese baseada maioritariamente em criação (como em todas as aplicações educativas baseadas em pesquisa na internet). passivo professor/sistema apresentação criação controlo envolvimento activo aluno síntese ● capítulo 5: aplicação didáctica de light fields 60 5.4 aplicação base utilizada – lightpack 1.0 em seguida é apresentada uma breve descrição sobre aspectos da aplicação base utilizada, nomeadamente, o modo de criação, visualização de light fields e arquitectura do sistema. 5.4.1 introdução a primeira implementação do conceito de light fields, lightpack 1.0 [levoy, 1996], foi inicialmente aplicada em plataforma sgi. a ferramenta desenvolvida por marc levoy e pat hanrahan é composta por duas aplicações: componente de geração de light fields: lifauth (light field authoring), que permite criar através de um conjunto de imagens o ficheiro com extensão “.lif” contendo um lf com determinada parametrização; componente de visualização de light fields: lifview (light field viewer) que permite visualizar o light field, a partir de um ficheiro “.lif” previamente gerado. a geração de lfs só era possível em sgi, enquanto que o lifview para além deste sistema funcionava também, de modo muito básico, em windows [levoy, 1996]. um novo desenvolvimento da aplicação, com a implementação dos extended light fields, foi realizado por patrick ohly [ohly, 2004] a partir da implementação existente lightpack 1.0. a fonte de dados, na versão de levoy, dependia de diversas bibliotecas e características exclusivas da plataforma sgi. assim, um dos objectivos principais da aplicação dos extended light fields foi a conversão para linux e opengl+glut [glut, 2005] [opengl, 2005]. as aplicações foram convertidas para linux [ohly, 2004], alterando as bibliotecas com implementações standard. a conversão revelou-se, no entanto, pouco fiável, sendo de muito difícil instalação em grande parte das distribuições linux disponíveis à data5 . a potencialidade de visualização de lfs em ambiente windows foi também perdida com esta conversão para linux sendo, deste modo, largamente reduzido o potencial didáctico da aplicação. 5 na realidade, após meses de interacção com os autores da aplicação, foi necessário recorrer a um especialista em sistema linux e programação em linguagem c para conseguir instalar a aplicação. capítulo 5: aplicação didáctica de light fields 61 5.4.2 criação de um light field no software de extended light fields, o processo de criação de um light field inicia-se com a geração de todas as imagens, o que se revela uma tarefa extremamente trabalhosa, difícil e que ocupa muito espaço de armazenamento, já que as transformações de vista devem ser as correctas para cada imagem. a base de dados de imagens assim criada (armazenada num ficheiro “.raw”), em conjunto com a sua geometria (armazenada num ficheiro “.lid”) pode ser utilizada para gerar o light field correspondente (que será armazenado num ficheiro “.lif”). a partir da aplicação do software de extended light fields, na plataforma linux, é portanto possível construir novos light fields com distintos parâmetros. estes parâmetros incluem, entre outros, qualidade e tamanho das imagens originais, nível de resolução do lf resultante, nível de compressão, afastamento dos planos uv e st, tipo de rendering e tipo de interpolação. 5.4.3 visualização de um light field a aplicação de visualização dos extended lfs possibilita visualizar os lfs gerados, em ambiente linux. a parte mais relevante de mudança foi a passagem de irisgl para opengl em ambiente linux. foi também estendida de modo a mostrar alguma informação básica sobre os extended light fields. a aplicação, embora limitada à visualização, em sistema linux, de um único lf indicado na linha de comando, contém, no entanto, algumas potencialidades interactivas relevantes. entres estas, incluem-se a possibilidade de alterar alguns parâmetros de visualização, utilizando o botão do direito do rato, incluindo o ângulo e posição de visualização e a possibilidade de efectuar zooms. 5.4.4 arquitectura do sistema o software do lightpack tem conceptualmente dois níveis de abstracção. ao mais alto nível encontra-se o lifauth e as bibliotecas dos light fields que fornecem um conjunto de operações que podem ser ministradas nos light fields. ao nível mais baixo tem-se as bibliotecas de gestão de light fields, que lidam com a gestão destes ficheiros. o capítulo 5: aplicação didáctica de light fields 62 ficheiro central chama as outras funções, iniciando-se com o comando lfbegin. as rotinas de dados iniciam o processo de construção de uma lista de operações que o programa deseja efectuar até ser executado o comando lfend. o objectivo de optimização é também desejado, portanto o lifauth funciona a dois passos: primeiro selecciona um conjunto de dados de treino e gera um vq codebook - vector quantization codebook (conjunto pequeno de quadrículas que pode ser utilizado para aproximar todas as quadrículas do light field). em seguida, lê os dados em formato rgb (extensão “.rgb”), comprime com o codebook e escreve no ficheiro “.lif”. apesar de a maior parte dos computadores não ter espaço de memória central suficiente para conter todos os dados “.rgb”, é utilizada a teoria do dataflow, assegurando-se que uma parte do light field, é comprimida e guardada antes de avançar para a parte seguinte. as bibliotecas libgeom e libvq providenciam funções que são utilizadas pela liblight. a biblioteca geom fornece algumas das funções de geometria utilizadas para a projecção e clipping dos planos uv e st, enquanto que as bibliotecas de vq lidam com a compressão “vector quantization”. 5.4.5 formato do ficheiro light field o ficheiro “.lif” (light field) é um único ficheiro que utiliza um formato próprio de descrição de light fields. é composto por duas partes: um cabeçalho e uma secção de dados binários. o cabeçalho contém informação sobre o número de “slabs” (que são unidades do light field, parametrizados pelos planos uv e st), a geometria espacial e informação como cada slab é guardado. a segunda secção consiste nos diversos segmentos (usualmente cada slab tem um) e outro tipo de dados, como por exemplo, vq codebooks para a compressão. assim sendo, o cabeçalho consiste em linhas de texto ascii e pode ser de tamanho variável. a primeira linha deverá conter o formato e versão “lif1.0” e a última linha do cabeçalho deverá conter a palavra-chave “endheader”. os comentários aparecem marcados com o símbolo “#”, como se pode analisar no exemplo que está contido na figura 27: capítulo 5: aplicação didáctica de light fields 63 figura 27: exemplo de um cabeçalho do formato “.lif”. no cabeçalho é também introduzido o valor corrente do tamanho do segmento e a definição do segmento inicia-se com a linha: “bgnlightfield 1”. de seguida, contém informação que é aplicada a todo o light field. a primeira linha deverá ser o número de slabs. por exemplo: “slabs 4 #view from south, west, north, east.”. após esta informação, o cabeçalho contem uma descrição de cada segmento de dados. cada segmento de dados pode conter um ou mais canais, ou seja, blocos contínuos de armazenamento. uma descrição do segmento contém outra informação específica a cada tipo de segmento, nomeadamente, um segmento slab conterá a dimensão e geometria do slab; um segmento codebook vq conterá o número de tiles (pequenos hiper cubos de pixels) e a dimensão dos mesmos. um tile comum terá a dimensão 2x2x2x2, o que significa que inclui um total de 16 pixels. em compressão vq o light field é dividido em tiles e o codebook consiste numa lista de tiles. um exemplo de um segmento slab está patente na figura 28: figura 28: exemplo de um segmento slab. capítulo 5: aplicação didáctica de light fields 64 5.4.6 rendering (volvis e volpack) um conceito modular é utilizado para a síntese de imagem. diferentes tipos de sintetizadores de imagem foram definidos na estrutura lf_renderertype, incluindo volpack, volvis, e renderman (a descrever adiante). todos os métodos de rendering utilizam a estrutura de dados (lfrenderer) que lhes indica as especificações sobre a qualidade, os argumentos e o tempo de entrada. o ficheiro a sintetizar é especificado por uma simples string a qual todos os renderers interpretam como o nome do ficheiro de dados. um número variável de argumentos pode ser escolhido de um vector de parâmetros disponíveis numa ordem configurável, uma vez que a ordem dos parâmetros deverá ser independente da ordem na qual o renderer espera os seus argumentos. os dados são armazenados num ficheiro com a extensão “.lid” que descreve a geometria do light field, indicando o tipo de rendering, passo, posição e o nível de qualidade. o renderer diz à aplicação que níveis de qualidade são suportáveis através da colocação de um campo na estrutura dos dados de renderer. cada método de rendering fornece funções lf*alloc(), lf*render(), lf*done() e lf*renderparams() que contêm os recursos de alocação e síntese de imagem para cada método. rendering é chamado com matrizes de modelo e projecção, bem como especificações das transformações de vista. de modo a simplificar a implementação, a estrutura global lfview contém uma representação diferente que especifica a posição do observador e foco, campo de visão, tamanho e método de transferir imagens para o plano de imagem, bem como as rotações redundantes do objecto. este é o modelo de vista utilizado pela aplicação lifview original. lf*renderparams() é utilizado para fornecer um visualizador com a habilidade para apresentar uma interpretação visual dos parâmetros e/ou dos dados a serem vistos. os métodos principais de rendering disponíveis e suas principais potencialidades, são os seguintes: • volpack. a utilização de volpack é limitada apesar das suas possibilidades. a string de configuração é utilizada com o nome de um ficheiro com extensão “.den” que fornece os dados em “bruto”. por isso toda a informação adicional como cor de mapeamento e iluminação são determinados pelo programa na altura de compilação e não com a configuração do renderer. capítulo 5: aplicação didáctica de light fields 65 • volvis. este método é mais versátil. lê os ficheiros do ambiente criados pela aplicação volvis e utiliza todos os objectos, a cor de mapeamento, os métodos de projecção, tais como especificados no ficheiro. a qualidade mapeia directamente os diferentes ajustes de qualidade do volvis, com uma excepção: qualidade 0 que implica utilizar o anteriormente referido volpack. • renderman. as ferramentas de blue moon rendering são chamadas para criar o rendering de um ficheiro rib. este ficheiro é composto por um cabeçalho que especifica as transformações de vistas correntes calculadas em renderman e o ficheiro de configuração. este ficheiro contém só a descrição do mundo sendo a imagem sintetizada escrita num directório temporário e carregada outra vez. por isso a velocidade de rendering é limitada e, para cenas complexas, não será possível atingir taxas de refrescamento que permitam visualização interactiva. os renderers são utilizados com dois objectivos: durante a criação de um light field a função lfreadslicefile() começa por procurar um ficheiro “.rgb” ou “.tiff” para a posição corrente no plano uv. se não for possível encontrá-lo, chama renderuv(), que calcula a posição da câmara de acordo com os parâmetros correntes uv. outra utilização é a síntese dos dados originais quando nenhum light field é carregado ou gerado, ou é induzido através do ajuste dos parâmetros no contexto no lfview. então os métodos de desenho chamam o renderer, em vez de iterar em cima dos slabs no light field. a cada actualização da janela no lifview é chamada esta função e a sintetização pode ser lenta. esta função agora simplesmente retorna a imagem posterior se nenhum parâmetro foi alterado entretanto. 5.5 aplicação didáctica de visualização a aplicação didáctica de visualização de light fields permite ao utilizador explorar funcionalidades de interacção alterando parâmetros e podendo optar pelo modo de visualização. a seguir são descritas estas opções, bem como o tipo de plataforma e as potencialidades requeridas ao sistema. capítulo 5: aplicação didáctica de light fields 66 5.5.1 plataforma de desenvolvimento seleccionada a aplicação didáctica de visualização foi desenvolvida para ambiente windows xp [windowsxp, 2007] e o seu acesso é efectuado a partir de um ficheiro executável. ficheiros separados contêm light fields distintos que podem ser visualizados com o auxílio da aplicação. a linguagem de programação em que foi desenvolvida a aplicação foi o c/c++ [kernighan, 1978], [stroustrup, 1994], utilizando o ambiente de desenvolvimento visual studio developer [visual studio, 2007], com recurso à api gráfica opengl. a escolha do sistema operativo windows xp como ambiente de desenvolvimento teve como justificação, essencialmente, o cariz didáctico desejado para a aplicação final. o sistema operativo windows é sem dúvidas o mais utilizado globalmente a nível mundial e em particular em portugal. deste modo, o potencial de utilização didáctica da aplicação desenvolvida é maximizado, permitindo inclusivamente a fácil realização do inquérito pretendido. a utilização do opengl (open graphics library) deveu-se ao facto de ser uma especificação de uma api multiplataforma e multi-linguagem. deste modo a sua utilização pode ser efectuada em sistemas windows, mas também, por exemplo, em sistemas linux. o open gl permite o desenvolvimento de aplicações gráficas 3d e contém mais de duas centenas de funções distintas que podem ser utilizadas para desenhar cenas tridimensionais complexas, sendo deste modo ideal para o desenvolvimento de aplicações de visualização de light fields. a utilização da linguagem c/c++ e o consequente ambiente de desenvolvimento visual developer studio da microsoft, deveu-se essencialmente à disponibilidade do software base de mark levoy [levoy, 1996] e versão subsequente de patrick ohly [ohly, 2004], construídos ambos em linguagem c. acrescem a este facto motivações específicas relativas à adequação da linguagem c/c++ ao desenvolvimento de aplicações interactivas, gráficas de visualização 3d, sobretudo quando associada à biblioteca opengl. as potencialidades do c/c++ adequadas à realização deste trabalho incluem: • ser uma linguagem com um núcleo extremamente simples, possuindo as funcionalidades não-essenciais, tais como funções matemáticas ou gestão de ficheiros, fornecidas por um conjunto de bibliotecas standard; • possibilidade de acesso de baixo-nível à memória do computador, através da utilização de apontadores (essencial na maioria das aplicações de computação gráfica); • disponibilização de estruturas de dados apropriadas, incluindo a possibilidade de programação orientada a objectos utilizando classes, objectos e métodos; capítulo 5: aplicação didáctica de light fields 67 • enorme eficiência da linguagem quando comparada com linguagens rivais (essencial em aplicações de computação gráfica e visualização tridimensional); • portabilidade dos programas desenvolvidos em c ou c++; • não exigências de overhead para facilidades que não são utilizadas; • a linguagem pode ser utilizada mesmo sem um ambiente de desenvolvimento sofisticado; • facilidade de utilização da biblioteca opengl em conjunto com a linguagem c++. o ambiente de desenvolvimento seleccionado permitiu, deste modo, construir a aplicação simples de visualização didáctica de light fields pretendida. 5.5.2 potencialidades requeridas ao sistema o sistema de visualização de light fields desenvolvido procurou conter uma série de funcionalidades genéricas de visualização de imagens, bem como algumas funcionalidades específicas de apresentação de componentes tridimensionais. as potencialidades genéricas que idealmente o sistema de visualização interactiva de light fields deve possuir são basicamente as seguintes: visualização de light fields criados através da captação de imagens de modo sequencial, utilizando câmaras apropriadas ou realizando a captura através de cenas virtuais; visualização de light fields criados com parâmetros distintos; apresentação através de um visualizador gráfico em ambiente windows, num computador pessoal, dos light fields criados; potencialidades de variação interactiva dos parâmetros de visualização dos light fields; possibilidade de execução de operações típicas de visualização de objectos tridimensionais tais como rotações, zooms e translações; inclusão de operações de visualização “didácticas” de light fields, direccionadas, exclusivamente para permitir uma melhor compreensão do conceito ao utilizador da aplicação. o software foi construído utilizando como base o trabalho de marc levoy [levoy, 1996] que já continha potencialidades básicas de leitura e visualização de light fields por linha de comando em ambiente linux ou sgi. capítulo 5: aplicação didáctica de light fields 68 5.5.3 interface gráfica da aplicação a interface gráfica da aplicação é intuitiva e simples de compreender as diversas categorias disponíveis. na figura 29 é apresentado o esquema da interface gráfica da aplicação. como é visível, a aplicação pretende ser muito simples, contendo uma barra de título, uma barra de menus que disponibiliza todos os comandos e uma área de visualização de lfs. todas as operações são também disponibilizadas através do teclado permitindo, deste modo, uma interactividade acrescida com o utilizador. figura 29: esquema da interface gráfica da aplicação de visualização de light fields. na figura 30 estão presentes três imagens representativas da interface gráfica da aplicação em distintas situações. figura 30: interface do programa de visualização de light fields. a aplicação de visualização está estruturada com menus que possibilitam as seguintes opções: definição do ficheiro a visualizar; menu de opções área de visualização dos lfs título da aplicação capítulo 5: aplicação didáctica de light fields 69 definição do tipo de zoom; método de interpolação a utilizar; tipo de refinamento a utilizar; opção de reinicialização da visualização; rotação do light field em qualquer direcção translação do light field. a aplicação possui menus que possibilitam a selecção das operações disponibilizadas. estas operações podem também ser seleccionadas utilizando o teclado. figura 31: visualização de uma rotação de 360º de um light field. capítulo 5: aplicação didáctica de light fields 70 na figura 31, é visível a rotação de 360º de um light field, sendo possível a visualização da transição entre pares de planos. 5.6 sítio web didáctico o sítio web didáctico completa a aplicação didáctica sendo a base de esclarecimento, a porta de entrada e guia para o desenvolvimento do conhecimento da técnica light fields. os objectivos a atingir e o modo como foi desenhado e concebido são descritos a seguir. 5.6.1 plataforma de desenvolvimento seleccionada a plataforma utilizada para a construção do sítio web foi o windows xp [windowsxp, 2007] e o ambiente de desenvolvimento para as páginas web, foi o macromedia dreamweaver mx 2004 [dreamweaver, 2007]. a escolha do windows deveu-se aos motivos já apontados com ênfase na sua muito grande divulgação. a escolha do dreamweaver deveu-se essencialmente à facilidade de utilização e simplicidade da execução do programa em ambiente windows. o macromedia dreamweaver é uma ferramenta de desenvolvimento para a web criada pela macromedia6 . versões iniciais da aplicação serviam como simples sistemas de edição html. no entanto, versões mais recentes incorporaram suporte para muitas outras tecnologias web tais como xhtml, css, javascript, entre outros [w3schools, 2007]. desde o final dos anos 90, o dreamweaver tem acumulado um sucesso crescente e possui actualmente cerca de 3/4 do mercado de editores html. existem versões para diversas plataformas tais como o mac os, embora a sua utilização seja mais generalizada no ambiente de desenvolvimento seleccionado para este trabalho: o windows xp. as razões da escolha do dreamweaver para este trabalho foram essencialmente: • facilidade de utilização e simplicidade da execução do programa; • editor de código e editor visual integrados numa interface única que pode ser personalizada; • previsão (preview) dos sítios web, tal como seriam visualizados na maioria dos navegadores web; 6 agora adobe systems após a sua aquisição em 2005. capítulo 5: aplicação didáctica de light fields 71 • vasto conjunto de ferramentas de gestão de sítios tais como a capacidade de pesquisa e substituição, no sítio completo, de linhas de texto ou de código, através de parâmetros especificados; • possibilidade de criação de javascript básico, sem quaisquer conhecimentos de programação; • ferramentas de criação de conteúdo dinâmico; • possibilidade de utilização de molduras (“frames”) de modo muito simples; • capacidade de copiar parcelas de documentos do microsoft word e excel preservando tipos de letra, cores e estilos; • arquitectura expansível com possibilidade de criação/utilização de pequenos programas “extensões” que podem ser criados e utilizados por qualquer desenvolvedor; • disponibilidade de uma elevada quantidade de modelos, estilos e layouts; • existência de uma ampla comunidade de utilizadores. acresce a este conjunto de motivações uma razão essencial de selecção do dreamweaver que consistiu na sua muito fácil utilização por criadores com pouca experiência na linguagem de programação. 5.6.2 potencialidades requeridas ao sistema o sítio web desenvolvido pretende ser uma ferramenta didáctica sobre a técnica light fields e, por isso, procurou conter uma série de funcionalidades típicas de sítios web didácticos, adaptadas ao tema em estudo. as potencialidades requeridas ao sítio web foram basicamente as seguintes: interface gráfica simples e apelativa; boa usabilidade para utilizadores com bons conhecimentos de informática; disponibilização de conceitos base organizados sobre os diversos temas mas também actividades extra e apontadores para material auxiliar/complementar; descrição dos conceitos base necessários à compreensão do conceito de light field, isto é, os conceitos de luz, iluminação e radiância; explicação da plenoptic function e da sua complexidade e apresentação do conceito e métodos básicos de image based rendering; explicação do conceito de light field e das suas possíveis representações e parametrizações; capítulo 5: aplicação didáctica de light fields 72 apresentação dos mais recentes desenvolvimentos na área da aquisição e visualização de light fields; disponibilização de actividades multimédia associadas aos diferentes conceitos; disponibilização de apontadores adequados que permitam ao utilizador aprofundar os seus conhecimentos sobre os conceitos abordados. deste modo, o sistema de aprendizagem desenvolvido pretende permitir a um utilizador com bons conhecimentos de informática ao nível de informática a aquisição agradável e muito rápida de conhecimentos básicos sobre light fields. 5.6.3 interface gráfica da sítio web o sítio web foi desenhado para conter sessões com conceitos e apontadores para dar a conhecer a base teórica e o desenvolvimento da técnica de light fields. assim sendo, são dez as sessões que constituem as páginas do sítio web: conceito de luz; iluminação; radiância; image based rendering; plenoptic function; representações e o processo de rendering; light fields; definição e representação do light field; programa de visualização; mais desenvolvimentos. na figura 32 encontra-se representado o esquema do sítio web desenvolvido. na moldura de topo foi introduzido um índice com acesso às dez sessões e, dentro destas, são apresentadas diversas actividades complementares e apontadores para consulta mais aprofundada e variada dos conceitos. é também apresentada a possibilidade de consulta da aplicação de visualização e um contacto para dúvidas. capítulo 5: aplicação didáctica de light fields 73 figura 32: esquema do sítio web sobre light fields. quando se efectua uma consulta a outros locais na internet são mantidas as molduras de topo e lateral ficando sempre disponível o índice, de modo a possibilitar ao utilizador o regresso ao local de origem; ou seja, as páginas de outros sítios web são visualizadas dentro da página do sítio web: aplicação didáctica de light fields. na sessão sobre o programa de visualização está disponibilizada a aplicação de visualização que numa fase posterior, na realização do inquérito apresentado no capítulo seguinte, será também analisada pelos utilizadores. esta aplicação poderia ser descarregada e executada em ambiente windows e encontrando-se disponível em todas as páginas. é de salientar que a última sessão pretendeu ser uma porta aberta para a compreensão dos novos avanços em light fields que estão presentemente a ser investigados e para as aplicações dos mesmos. o interface gráfico é simples, prático e de fácil compreensão, já que a estrutura é linear e com um menu descritivo das sessões disponíveis. contém hipertexto, imagens e vídeos que enriquecem o sítio web. as potencialidades incluídas no sítio web e aplicação referentes à visualização e interactividade permitem desenvolver a atenção e motivação perante os novos conceitos. como foi abordado na secção 5.1.2, sobre visualização e interactividade, ao utilizar este tipo de aplicação o aluno compreenderá e sentir-se-á mais motivado para a compreensão dos novos conceitos. título do sítio web corpo do sítio web actividades apontadores aplicação contacto menu de opções/índice capítulo 5: aplicação didáctica de light fields 74 figura 33: imagem da sessão sobre mais desenvolvimentos na área de light fields. na figura 33 encontra-se representada uma imagem do sítio web desenvolvido, sendo visíveis as diferentes secções do sítio e a interface gráfica que, como se pode observar, seguiu linhas simples de fácil compreensão e entendimento. é de realçar o cuidado e organização na elaboração das páginas do sítio web, sendo que para cada tema há uma página diferente. o recurso a imagens, vídeos e actividades foram escolhidos atendendo ao tema e com o objectivo de transmitir mais facilmente os conceitos abordados. 5.7 sumário do capítulo nesta secção da dissertação foi apresentado o desenvolvimento efectuado da aplicação didáctica de light fields composta por uma aplicação de visualização e um sítio web. a aplicação de visualização foi desenvolvida em ambiente windows, utilizando a linguagem c++ e a biblioteca opengl. a aplicação didáctica de light fields vem por um lado transformar a abordagem a este assunto, facilitando a compreensão da concepção do lf através da sua visualização interactiva e da disponibilização de conteúdos multimédia de suporte à aprendizagem, adequados. por outro lado, a sua disponibilização em sistema operativo windows permite que o seu potencial didáctico seja muito mais alargado. deste modo foi possível a realização de um estudo exploratório a utilizadores com bons conhecimentos de informática de modo a averiguar as potencialidades da aplicação desenvolvida, no processo de ensino/aprendizagem do conceito de light field. índice/menu de opções apontadores de pesquisa adicional corpo do sítio web com os conceitos capítulo 6 6. estudo exploratório a motivação para aprender é um fenómeno complexo e um tema intimamente ligado à psicologia e educação. a motivação pode ser encarada como um processo e não como um produto [pintrich, 2002], embora seja possível estudá-la pelos comportamentos que ele produz. a motivação envolve objectivos que requerem esforço, persistência, planeamento, tomada de decisões e resolução de problemas. exige também o conhecimento de como cada um responde às dificuldades e fracassos encontrados. este capítulo pretende responder à questão sobre a importância da utilização prática da aplicação didáctica de light fields desenvolvida para a compreensão da teoria subjacente aos conceitos e analisar a necessidade da mesma, para que a motivação perante este método se mantenha elevada. em termos de objectivos pretendidos do estudo, estes consistem em avaliar a influência do sítio web e da utilização da aplicação de visualização de lf em utilizadores com e sem conhecimentos em computação gráfica. 6.1 metodologia e objectivos a metodologia praticada seguiu as etapas gerais da investigação baseada em inquérito [hill et al., 2005], começando pela definição dos objectivos do inquérito, construindo o planeamento e desenho geral do mesmo. a investigação realizada foi baseada num estudo: observacional: uma vez que não há, à partida, o conhecimento e controlo sobre o tipo de indivíduos que responde e analisa as variáveis; analítico: já que pretende estudar a relação entre as variáveis e colocar à prova uma hipótese de investigação; capítulo 6: estudo exploratório 76 transversal: porque se analisam as respostas num dado momento do tempo, sem haver preocupação de por quanto tempo manterão estas características, nem de como foram adquiridas, sendo que a interpretação dos dados obtidos foi avaliada posteriormente com testes estatísticos. recorrer a este tipo de investigação é comum no âmbito do conhecimento ao nível educacional [tuckman, 2002] e permite obter dados úteis para a melhor condução do processo educativo até atingir objectivos pré-determinados. a evolução da visualização de dados e de informação tem-se mostrado uma área científica cada vez mais profunda, uma vez que a investigação começa a estabelecer fundamentos e teorias nesta área. a avaliação é sobretudo qualitativa, o que motiva a minimização de erros, sendo possível estabelecer métricas que traduzam a precisão e a tendência no sentido de melhorar a eficácia e eficiência. portanto, o conhecimento dos processos de percepção visual é mais um caso de análise. todavia, este conhecimento depende do utilizador que tem de ser incluído no estudo e, ao sê-lo, a sua opinião deve ser avaliada e avalizada. assim sendo, advém, deste facto, a importância da resposta perante as hipóteses de utilização da aplicação para a obtenção do melhor conhecimento teórico dos light fields. perante estes objectivos gerais e realizado o estudo dos fundamentos e métodos similares foi delineado um questionário que obedeceu à seguinte estrutura: a introdução do questionário incluiu um pedido de cooperação para o preenchimento, indicando uma estimativa do tempo necessário, a razão da aplicação do questionário e a natureza académica da investigação. o primeiro bloco de questões refere-se à caracterização sócio-profissional do inquirido: sexo, idade, habilitações literárias e profissão. o segundo bloco diz respeito ao nível de conhecimento sobre computação gráfica e utilização de aplicações de visualização de imagens. o terceiro bloco refere-se, na continuação do anterior, aos conhecimentos prévios sobre os conceitos que são explicados no sítio web. o quarto bloco refere-se aos conhecimentos adquiridos após a análise teórica por consulta do sítio web. o quinto bloco envolve a aplicação de visualização da técnica de image based rendering e refere-se ao modo como o utilizador percepciona as cenas com diferentes parâmetros. capítulo 6: estudo exploratório 77 o sexto bloco refere-se aos conhecimentos adquiridos após manuseamento da aplicação de visualização de light fields. quanto ao tipo de questões introduzidas procurou-se que fossem concisas, de fácil compreensão e na maior parte delas as respostas eram fechadas, isto é, com as diferentes possibilidades já definidas, o que trouxe vantagens evidentes para a análise estatística posterior. o questionário também inclui questões de resposta aberta, para complementar e confirmar a informação fornecida pelos inquiridos, possui as indicações e passos que o utilizador deveria seguir para o preencher. nessas indicações foi introduzido o apontador do sítio que disponibilizava as sessões com os conceitos sobre luz, iluminação, radiância, image based rendering, plenoptic function, rendering e light fields. na figura 34 encontra-se uma representação do aspecto geral do questionário elaborado. no anexo 1, pode ser encontrado o questionário completo. figura 34: aspecto geral do questionário elaborado. é de salientar que, num primeiro momento, tal como é aconselhado na literatura da especialidade [hill et al., 2005] foi realizado um estudo preliminar aplicando uma versão prévia do questionário final. o objectivo consistiu em seleccionar as perguntas adequadas para serem incluídas na versão final. a experiência efectuada foi presencial, com um grupo de voluntários nas instalações da faculdade de engenharia da universidade do porto (feup), para compreender as reacções dos inquiridos ao questionário, ao sítio web e à aplicação, assim como verificar se surgiriam dúvidas quanto aos passos a dar para responderem às perguntas. assim capítulo 6: estudo exploratório 78 sendo, foram introduzidas algumas alterações ao questionário ao nível de encaminhamento e algumas questões reformuladas ou mesmo eliminadas, uma vez que a sua relevância para o estudo era diminuta. de um modo geral, os inquiridos desta fase entenderam o que lhes estava a ser proposto, responderam ao questionário, colocaram dúvidas e deram opiniões perante o que estava a ser analisado. figura 35: interface do site da aplicação didáctica de light fields. na recolha de dados, o método utilizado foi a divulgação através da internet, uma vez que um dos objectivos iniciais seria abordar indivíduos com bons conhecimentos de informática. posteriormente, foi realizado um estudo dos dados para se obter a análise descritiva e inferência dos mesmos utilizando a ferramenta spss 15.0 (statistical package for the social sciences) para windows [spss, 2007]. assim sendo, foram definidas as variáveis e introduzidos os dados. os tipos de escalas para as variáveis apresentadas foram: nominais: este tipo de escala consiste num conjunto de categorias de resposta qualitativamente diferentes e mutuamente exclusivas, como por exemplo, sexo e profissão. ordinais: este tipo de escala admite uma ordenação numérica das suas categorias, ou seja, das respostas alternativas, estabelecendo uma relação de ordem entre elas, como por exemplo as variáveis que mediram o nível de conhecimento. de rácio: este tipo de escala tem a característica da escala ordinal, em que o valor numérico mais elevado na escala indica uma quantidade maior da variável capítulo 6: estudo exploratório 79 medida. outra característica adicional indica que as diferenças entre valores numéricos adjacentes na escala permanecem iguais na quantidade da variável medida e o valor “zero” não é arbitrário, como por exemplo, a variável idade. 6.2 população e amostra nesta secção é apresentado o tipo de utilizadores que fizeram parte do estudo estatístico e que contribuíram para a avaliação e balanço da utilização da aplicação didáctica sobre a técnica de light fields. a população deste estudo foi constituída por utilizadores com bons conhecimentos em informática. a amostra recolhida envolveu 102 indivíduos que estudam ou trabalham em território português, sendo que a amostra pode ser classificada como não- probabilística, uma vez que quem participou no inquérito tinha de ser utilizador de computador e ter acesso à internet, e de conveniência, já que os indivíduos se encontravam acessíveis ao investigador. idade frequência abso- luta frequência rela- tiva 18 4 3,9 19 5 4,9 20 2 2,0 21 1 1,0 22 3 2,9 23 3 2,9 24 9 8,8 25 9 8,8 26 8 7,8 27 9 8,8 29 2 2,0 30 6 5,9 31 6 5,9 32 2 2,0 33 5 4,9 34 1 1,0 35 7 6,9 36 6 5,9 37 3 2,9 38 3 2,9 39 1 1,0 40 4 3,9 41 1 1,0 45 2 2,0 total 102 100,0 tabela 1: frequência da idade dos indivíduos da amostra. capítulo 6: estudo exploratório 80 como se pode analisar na tabela 1, a amostra é caracterizada por ser jovem, uma vez que as idades estão compreendidas entre os 18 e os 45 anos. a variável idade é trimodal, sendo que os valores que têm maior frequência absoluta são os 24, 25 e 27 anos. relativamente ao nível de escolaridade e pela análise da figura 36 conclui-se que a maior percentagem de inquiridos possui o grau de licenciatura, com uma percentagem de 31%. é de realçar que o nível de habilitações literárias se encontra entre o 12º ano e ensino superior e que o mais alto grau académico, ou seja, doutoramento correspondia uma percentagem de 25%. habilitações literárias da amostra 24% 1% 31% 19% 25% até ao 12º bacharelato licenciatura mestrado doutoramento figura 36: gráfico das percentagens das habilitações literárias da amostra. a amostra é constituída por 89% de indivíduos do sexo masculino e 11% do sexo feminino. esta diferença é típica na comunidade informática onde os indivíduos do sexo masculino são normalmente maioritários. sexo dos inquiridos 11% 89% feminino masculino figura 37: gráfico das percentagens do sexo dos inquiridos. capítulo 6: estudo exploratório 81 relativamente ao tipo de utilizador, pode ser observado na tabela 2 que, no total de 102 inquiridos, se encontra a maior frequência no nível “bastante” em relação à experiência com programas de visualização de imagens e “alguma” experiência em modelação gráfica num total de 22 inquiridos. por outro lado, em relação à frequência mais baixa, zero casos, são várias as possibilidades, tais como: ter “pouca” experiência em modelação gráfica e “nenhuma” experiência com programas de visualização de imagens; ter “muita” experiência em modelação gráfica e “bastante” experiência com programas de visualização de imagens ou também ter “bastante” experiência em modelação gráfica e ter “muita” experiência com programas de visualização. experiência com programas de visualização de imagens nenhuma pouca alguma bastante muita total nenhuma 5 9 7 3 0 24 pouca 0 5 14 13 0 32 alguma 0 0 9 22 4 35 bastante 0 0 0 4 0 4 experiência em modelação gráfica muita 0 0 0 0 7 7 total 5 14 30 42 11 102 tabela 2: tipo de conhecimentos em computação gráfica vs experiência com programas de visualização de imagens. foram também analisadas as respostas em relação ao tipo de inquirido relativamente aos conhecimentos em computação gráfica. na tabela 3, verifica-se a frequência absoluta nos dois casos: existindo 61 inquiridos com conhecimentos e 41 sem conhecimentos. frequência absoluta frequência relativa com conhecimentos 61 59,8 sem conhecimentos 41 40,2 total 102 100,0 tabela 3: nível de conhecimentos em computação gráfica. os conhecimentos que possuíam à partida sobre os conceitos mais específicos tais como image based rendering (ibr) e light field (lf) foram também recolhidos. as tabelas 4 e 5 correspondem às frequências absolutas relativas ao tipo de resposta. note-se que foram colocadas questões de resposta aberta para verificar se, de facto, os inquiridos manifestavam esses conhecimentos. capítulo 6: estudo exploratório 82 frequência absoluta frequência relativa frequência rela- tiva acumulada nenhum 37 36,3 36,3 pouco 52 51,0 87,3 algum 4 3,9 91,2 bastante 9 8,8 100,0 muito 0 0,0 100,0 total 102 100,0 tabela 4: nível de conhecimento do conceito de ibr. frequência absoluta frequência relativa frequência rela- tiva acumulada nenhum 62 60,8 60,8 pouco 31 30,4 91,2 algum 2 2,0 93,1 bastante 7 6,9 100,0 muito 0 0,0 100,0 total 102 100,0 tabela 5: nível de conhecimento do conceito de light field. assim sendo, e pela análise das tabelas 4 e 5, verifica-se que 87,3% dos inquiridos referiu ter poucos ou nenhuns conhecimentos de image based rendering e que 91,2% dos inquiridos referiu que tinha poucos ou nenhuns conhecimentos sobre o conceito de light field, apesar de a maior parte ter conhecimentos em computação gráfica. a percentagem que respondeu ter “bastantes” conhecimentos de ibr e lfs foi respectivamente 8,8% e 6,9% o que revela o pouco conhecimento nesta matéria. destaca-se ainda que ninguém respondeu possuir “muitos” conhecimentos em nenhuma destas matérias. concluída a análise dos dados iniciais e o nível de conhecimentos da amostra em estudo, foram levantadas as hipóteses relativas ao modo de evolução dos conhecimentos adquiridos pelos indivíduos, com posterior acesso ao sítio web e aplicação da ferramenta de visualização de light fields. para compreender melhor o tipo de investigação efectuada por questionário é essencial abordar alguns aspectos teóricos sobre os procedimentos a tomar e em que se baseiam. 6.3 procedimentos a análise estatística pode ser efectuada a partir da descrição dos resultados dos dados, como foi apresentada no subcapítulo anterior, para caracterizar a amostra em estudo ou capítulo 6: estudo exploratório 83 pode, alternativamente, ser baseada numa análise inferencial. neste último caso podem utilizar-se duas abordagens: estimação de parâmetros: usando a informação de uma estatística amostral podem tirar-se conclusões sobre o valor de um parâmetro da população os quais são apresentados com intervalos de confiança. testes de hipóteses: usando a informação sobre um parâmetro da população é possível decidir se uma hipótese (pressuposto) sobre um parâmetro da população deve ou não ser rejeitada. a selecção da estatística inferencial é orientada para a pergunta que precisa de ser respondida. dentro da abordagem dos testes de hipóteses, e, de modo que a probabilidade de cometer um erro tipo i (rejeitar a hipótese sendo ela verdadeira) seja facilmente calculada, deve-se formular a hipótese tendo em vista assumir exactamente o oposto do que queremos provar. ou seja, se se pretende verificar que o sítio web influencia o nível de conhecimento dos inquiridos, o pressuposto a admitir será que não há diferenças em relação ao nível de conhecimento antes e após consulta ao sítio web. assim se compreende o significado de hipótese nula, quando esta contém a afirmação de não haver diferenças. a hipótese alternativa discorda da hipótese nula e, se a hipótese nula é rejeitada em resultado da evidência, a hipótese alternativa é a conclusão. por outro lado, se não houver evidência suficiente para rejeitar a hipótese nula, ela mantém-se, mas não é aceite, apenas se podendo afirmar que não se pode rejeitar. o tipo de teste a utilizar depende dos factores iniciais do problema e também deve ser escolhido o nível de significância antes de utilizar o teste estatístico. este valor é designado por valor α e indica a probabilidade de rejeitar a hipótese nula quando é, de facto, verdadeira. esta probabilidade deverá ser pequena, porque não se deve cometer o erro tipo i, sendo α igual a 0,05 o valor tradicional. um outro conceito importante ligado à significância estatística é o valor p. o valor p (p_value) está relacionado com o teste de hipótese, correspondendo à probabilidade de obter um resultado mais extremo do que o observado, se a hipótese nula é verdadeira. se o valor estiver próximo de zero, é um indicador de que a hipótese nula é falsa, enquanto que se estiver próximo de um, não há evidência suficiente para a rejeitar. o valor p é calculado depois de realizado o teste estatístico e, se for menor do que α, rejeita-se a hipótese nula. para a determinação do valor p foi utilizada a ferramenta spss, que permite incorporar este valor no output dos resultados dos testes estatísticos que realiza. resumindo, o procedimento que se pode observar no esquema da figura 38, para a realização do teste de hipóteses apresentado neste trabalho é o seguinte: enunciar a hipótese nula e a alternativa; capítulo 6: estudo exploratório 84 fixar o limite para o nível de significância α e identificar a distribuição da estatística; escolher o teste estatístico a efectuar, perante as condições da amostra e variáveis em estudo; observar o valor p e comparar com o nível de significância α; retirar as conclusões e esclarecer as evidências estatísticas no contexto das hipóteses. figura 38: diagrama esquemático do processo dos testes de hipóteses. alguns dos pontos mais importantes na aplicação de um teste de hipóteses correspondem a reconhecer a situação experimental em função das variáveis envolvidas, a escala em que estão medidas as variáveis e caracterizar o tipo de experiência: amostras constituídas por medições feitas repetidamente nas mesmas unidades experimentais ou em unidades experimentais distintas. para realizar testes e inferências em que os parâmetros são proporções (percentagens ou probabilidades) e não médias, o teste a aplicar será baseado em contagens e são adequados para variáveis numa escala nominal ou ordinal. neste trabalho surgiram dois tipos distintos de situações: comparação de proporções em duas amostras independentes (utilizadores com e sem conhecimento em computação gráfica), utilizando a distribuição qui- quadrado; comparação de proporções em duas amostras emparelhadas (nível de conhecimento antes e após consulta do sítio web e antes e após a experiência com a aplicação de visualização dos lfs), baseado na distribuição qui- quadrado. enunciar as hipóteses nível de significância (α) escolher o teste estatístico comparar o valor p com o nível de significância α conclusões capítulo 6: estudo exploratório 85 figura 39: diagrama esquemático da escolha dos testes de hipóteses. na figura 39 estão representadas esquematicamente as possibilidades de aplicação de testes de hipóteses na análise inferencial. o caminho utilizado para atingir o tipo de testes utilizado para responder às questões, e dependendo das condições iniciais, está salientado a cor mais clara. assim sendo, dado que os métodos utilizados se baseiam em contagens, que não é conhecida a média da população e porque as variáveis a estudar são ordinais, resulta que os parâmetros a estimar são proporções e não médias. dentro deste campo encontram-se, portanto, os testes que convêm: comparação de proporções em amostras independentes (utilizadores com e sem conhecimentos em computação gráfica) e comparação de proporções em amostras emparelhadas (nível de conhecimento antes e após facultar o sítio web e, posteriormente, a aplicação de visualização de lfs). os testes mcnemar e marginal homogeneity [reis, 2001] regem- análise inferencial intervalos de confiança (…) testes de hipóteses distribuição normal?sim não desvio padrão (σ) da população conhecido? parâmetros a estimar médias proporções sim não teste z teste t amostras emparelhadas? sim não teste t para amostras emparelhadas variância igual? teste fsim não teste t com σ1=σ2 teste t com σ1≠σ2 teste não paramétrico comparação em duas amostras independentes (qui-quadrado) comparação em duas amostras emparelhadas (mcnemar e marginal homogeneity) qualidade de ajuste capítulo 6: estudo exploratório 86 se pelo mesmo princípio, contudo enquanto o mcnemar é um teste para variáveis dicotómicas, o marginal homogeneity serve para variáveis multinomiais. as hipóteses em estudo são, numa primeira fase, verificar se há evidências estatísticas para afirmar que os conhecimentos são diferentes antes e após a consulta ao sítio web e que os conhecimentos dos inquiridos são diferentes antes e após o acesso à ferramenta de visualização de light fields. desta forma e exemplificando para o conceito de ibr, a primeira hipótese nula é: não há diferenças nas respostas sobre o conhecimento do conceito de image based rendering antes e após a consulta ao sítio web, enquanto que a hipótese alternativa é: há diferenças sobre o nível de conhecimento do conceito de image based rendering após a consulta ao sítio web. para os outros conceitos é aplicado o mesmo teste sendo análogo o processo. para testar as hipóteses e sabendo que o tipo de variável em estudo é ordinal foi aplicado o teste de hipóteses de comparação de proporções em amostras emparelhadas (marginal homogeneity). sabendo que o p_value neste caso é 0,00 e é menor do que α, há evidências estatísticas para afirmar, com um nível de significância de 5%, que há diferenças no nível de conhecimento sobre ibr antes e após a análise do sítio web em seguida, analisaram-se as respostas perante a análise dos conceitos luz, iluminação, radiância, plenoptic function, light field e entendimento dos planos uv e st. um outro tipo de análise efectuada corresponde ao teste de hipóteses sobre o nível de conhecimento destes conceitos antes e após a utilização da aplicação de visualização de light fields. o teste aplicado também é sobre comparação de proporções em duas amostras emparelhadas. para perceber como diferia o nível de conhecimento entre os inquiridos com e sem conhecimentos em computação gráfica foi aplicado o teste de comparação de proporções de amostras independentes, uma vez que há a possível separação em dois grupos distintos. foi interessante observar e analisar a variação no nível de conhecimento destes dois grupos, numa primeira fase após a consulta ao sítio web e, numa segunda fase, após a experiência com o programa de visualização de lfs. a variável tempo também foi contabilizada sendo que a média de análise e preenchimento do questionário é importante salientar. no subcapítulo seguinte estão descritos os resultados obtidos decorrentes destas experiências. capítulo 6: estudo exploratório 87 6.4 resultados obtidos a primeira experiência foi relativa à utilização do sítio web para consulta dos conceitos apresentados, como luz, iluminação, radiância, image based rendering, plenoptic function, light field e entendimento dos planos uv e st. conceito hipóteses hip. nula | hip. alter. p_value evidências estatísticas (nível de signficância de 0,05) luz 0,000 há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito luz é diferente antes e após a consulta do sítio.. iluminação 0,000 há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito iluminação é diferente antes e após a consulta do sítio. radiância 0,000 há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito radiância é diferente antes e após a consulta do sítio.. image based rendering 0,000 há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito ibr é diferente antes e após a consulta do sítio.. plenoptic function 0,000 há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito plenoptic function é diferente antes e após a consulta do sítio.. light field 0,000 há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito lf é diferente antes e após a consulta do sítio.. planos uv e st não há diferenças quanto ao nível de conhecimento do conceito antes e após a consulta do sítio web. há diferenças quanto ao nível de conhecimento do conceito antes e após a a consulta do sítio web. 0,000 há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de entendimento dos planos uv e st é diferente antes e após a consulta do sítio.. tabela 6: evidências estatísicas quanto às diferenças do nível de conhecimento após análise do sítio web. em relação aos dados obtidos, pode, através do quadro resumo apresentado na tabela 6, inferir-se que há evidências estatísticas, a um nível de significância de 0,05, para afirmar que há diferenças quanto ao nível de conhecimentos sobre os conceitos apresentados antes e após consulta do sítio web. como seria de esperar e se pode observar, há evidências estatísticas para afirmar que a um nível de significância de 5%, a distribuição das variáveis sobre o nível de entendimento dos conceitos apresentados é diferente antes e após a consulta do sítio web. este resultado seria de esperar mas destacam-se os valores obtidos para os capítulo 6: estudo exploratório 88 p_values, aproximadamente nulos, mostrando sem margem para dúvidas a existência de evidências estatísticas para afirmar que a distribuição das variáveis sobre os níveis de conhecimento dos diferentes conceitos é diferente antes e após a consulta do sítio web. as tabelas 7 e 8 permitem empiricamente confirmar que houve um maior número de respostas que passou a ter um nível de compreensão “bastante” e muito”, com uma percentagem de 75,5% (= 50%+25,5%), enquanto que anteriormente estes dois níveis tinham uma percentagem de resposta de 39,2%, ou seja um aumento de 36,3%. nota-se, contudo, que ainda houve uma percentagem de 4,9% de respostas que afirma ter “nenhum” entendimento sobre o conceito de luz após análise do sítio web. frequência absoluta frequência relativa frequência rela- tiva acumulada nenhum 9 8,8 8,8 pouco 9 8,8 17,6 algum 44 43,1 60,8 bastante 36 35,3 96,1 muito 4 3,9 100,0 total 102 100,0 tabela 7: frequência absoluta e relativa do nível de compreensão do conceito de luz antes da análise do sítio web. frequência absoluta frequência relativa frequência rela- tiva acumulada nenhum 5 4,9 4,9 algum 20 19,6 24,5 bastante 51 50,0 74,5 muito 26 25,5 100,0 total 102 100,0 tabela 8: frequência absoluta e relativa do nível de compreensão do conceito de luz após análise do sítio web. as tabelas 9 e 10 referem-se às frequências para o nível de compreensão do conceito de light field antes e após consulta do sítio web. frequência absoluta frequência relativa frequência rela- tiva acumulada nenhum 84 82,4 82,4 pouco 9 8,8 91,2 algum 7 6,9 98,0 bastante 2 2,0 100,0 muito 0 0 100,0 total 102 100,0 tabela 9: frequência absoluta e relativa do nível de compreensão do conceito de light field. capítulo 6: estudo exploratório 89 frequência absoluta frequência relativa frequência rela- tiva acumulada nenhum 13 12,7 12,7 pouco 40 39,2 52,0 algum 34 33,3 85,3 bastante 14 13,7 99,0 muito 1 1,0 100,0 total 102 100,0 tabela 10: frequência absoluta e relativa do nível de compreensão do conceito de light field após análise do sítio web. é de salientar que para a maior parte dos indivíduos (82,4%), o conceito de light field era completamente desconhecido. pelo mesmo princípio é justificado o aumento das frequências nas respostas de “alguma” e “bastante” compreensão do conceito de lf. os outros conceitos também sofreram este tipo de mudanças. a segunda experiência foi relativa à análise do nível de conhecimento dos conceitos após a utilização do programa de visualização de lfs. assim sendo, foram analisadas as evidências estatísticas relativamente ao nível de conhecimentos antes e após a experiência com o programa de visualização de lfs, considerando a mesma amostra com 102 elementos. na tabela 11 estão apresentados os resultados obtidos para o p_value e a respectiva interpretação. através da tabela 11 é possível verificar que não há evidências estatísticas para afirmar que o entendimento sobre os conceitos de luz, iluminação, radiância, image based rendering e plenoptic function sejam diferentes antes e após a experiência com a aplicação de visualização de lfs. porém, relativamente ao conceito de lfs e entendimento sobre os planos uv e st, há evidências estatísticas, a um nível de significância de 5%, para afirmar que as distribuições são diferentes antes e após a utilização da aplicação de visualização de lfs. para uma completa avaliação é ainda importante obter resultados relativamente ao nível de entendimento dos conceitos antes e após utilização da aplicação de visualização de lfs, mas tendo em vista o tipo de indivíduo que já possuía conhecimentos em computação gráfica e aquele que não os tinha. assim, foi aplicado o teste de comparação de proporções de amostras independentes, a um nível de significância de 5%. da aplicação deste teste conclui-se que há evidências estatísticas para afirmar que a distribuição da variável entendimento de light fields não é idêntica nos grupos de indivíduos com e sem conhecimentos em computação gráfica, já que o valor p obtido, que foi de 0,001, é claramente inferior ao nível de significância fixado. capítulo 6: estudo exploratório 90 conceito hipóteses hip. nula | hip. alter. p_value evidências estatísticas (nível de signficância de 0,05) luz 1,000 não há evidências estatísticas para afirmar que, a distribuição das variáveis sobre o nível de conhecimento do conceito luz é diferente antes e após a utilização da aplicação de visualização de lf’s. iluminação 0,796 não há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito iluminação é diferente antes e após a utilização da aplicação de visualização de lf’s. radiância 0,297 não há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito radiância é diferente antes e após a utilização da aplicação de visualização de lf’s. image based rendering 0,433 não há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito ibr é diferente antes e após a utilização da aplicação de visualização de lf’s. plenoptic function 0,134 não há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito plenoptic function é diferente antes e após a utilização da aplicação de visualização de lf’s. light field 0,000 há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito light field é diferente antes e após a utilização da aplicação de visualização de lf’s. planos uv e st não há diferenças quanto ao nível de conhecimento do conceito antes e após a utilização e experiência com a aplicação de visualização de lf’s. há diferenças quanto ao nível de conhecimento do conceito antes e após a utilização e experiência com a aplicação de visualização de lf’s. 0,000 há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de entendimento do funcionamento dos planos uv e st é diferente antes e após a utilização da aplicação de visualização de lf’s. tabela 11: evidências estatísicas quanto às diferenças do nível de conhecimento experiência com o programa de visualização de lfs. nas tabelas 12 e 13 podem encontrar-se os dados que confirmam a afirmação anterior. capítulo 6: estudo exploratório 91 conceito hipóteses hip. nula | hip. alter. p_value evidências estatísticas (nível de signficância de 0,05) image based rendering 0,134 não há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito ibr é diferente antes e após a utilização da aplicação de visualização de lf’s. plenoptic function 0,655 não há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito plenoptic function é diferente antes e após a utilização da aplicação de visualização de lf’s. light field 0,131 não há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito lf’s é diferente antes e após a utilização da aplicação de visualização de lf’s. planos uv e st não há diferenças quanto ao nível de conhecimento do conceito antes e após a utilização e experiência com a aplicação de visualização de lf’s há diferenças quanto ao nível de conheciment o do conceito antes e após a utilização e experiência com a aplicação de visualização de lf’s. 1,000 não há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de entendimento dos planos uv e st é diferente antes e após a utilização da aplicação de visualização de lf’s. tabela 12: evidências estatísticas quanto às diferenças do nível de conhecimento após experiência com o programa de visualização de lfs em indivíduos sem conhecimento em cg. conceito hipóteses hip. nula | hip. alter. p_value evidências estatísticas (nível de signficância de 0,05) image based rendering 0,527 não há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito ibr é diferente antes e após a utilização da aplicação de visualização de lf’s. plenoptic function 0,035 há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito plenoptic function é diferente antes e após a utilização da aplicação de visualização de lf’s. light field 0,000 há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de conhecimento do conceito lf’s é diferente antes e após a utilização da aplicação de visualização de lf’s. planos uv e st não há diferenças quanto ao nível de conhecimento do conceito antes e após a utilização e experiência com a aplicação de visualização de lf’s há diferenças quanto ao nível de conheciment o do conceito antes e após a utilização e experiência com a aplicação de visualização de lf’s. 0,000 há evidências estatísticas para afirmar que a distribuição das variáveis sobre o nível de entendimento dos planos uv e st é diferente antes e após a utilização da aplicação de visualização de lf’s. tabela 13: evidências estatísicas quanto às diferenças do nível de conhecimento após experiência com o programa de visualização de lfs em indivíduos com conhecimento em cg. capítulo 6: estudo exploratório 92 é interessante observar que, quando se faz a distinção entre o tipo de utilizador, com ou sem conhecimentos em computação gráfica, os tipos de conclusões a retirar são diferentes. para aqueles que têm conhecimentos em computação gráfica, há evidências estatísticas para afirmar que a um nível de significância de 5%, a distribuição de variáveis sobre o nível de conhecimento é diferente antes e após a experiência com a aplicação de visualização de lfs, o mesmo não ocorrendo quando o utilizador não tem conhecimentos em computação gráfica. a seguir serão apresentadas a discussão e a análise dos resultados obtidos para melhor entender as razões e consequências deste estudo. 6.5 discussão e análise dos resultados neste trabalho foram estudadas as repercussões que a aplicação didáctica de lfs pode ter nos utilizadores de computador, principalmente as diferenças do nível de conhecimento adquirido, perante conceitos complexos e novos de computação gráfica, pelos utilizadores com uma base sólida de conhecimentos nesta área e utilizadores que apesar de não terem conhecimentos específicos têm vasta experiência em informática e trabalham com computadores diariamente. os resultados obtidos esclarecem que o nível de conhecimento de todos os conceitos aumentou, como seria de esperar, após a consulta ao sítio web, uma vez que os conceitos estão explicados teoricamente. esta componente teórica serviu de apoio base para a introdução da componente prática, através da aplicação de visualização de lfs. é de realçar que neste estudo, há alguns constrangimentos e limitações a focar, nomeadamente o facto de não ter sido efectuada a experiência para analisar o tipo de resposta dos utilizadores perante o facto de estarem confrontados simplesmente com a aplicação antes do acesso aos conceitos teóricos. contudo, neste trabalho era importante que os inquiridos tivessem contacto, mesmo sendo ligeiro, de algum conhecimento na área. outra limitação é o facto da amostra ter sido por conveniência, uma vez que todos os utilizadores têm acesso diário às ferramentas do pc, ficando de fora outras possíveis análises sobre o modo como outros grupos de indivíduos responderiam a este tipo de conhecimento. outra consideração trata-se do tempo que o grupo esteve perante os conceitos, não sendo suficiente para fazer consultas pormenorizadas aos apontadores de apoio. em média para a consulta ao sítio web, a experiência com a aplicação de visualização de lfs e o preenchimento do questionário foi dispendido um período de uma hora, que manifestamente não é suficiente para a análise de todos os apontadores disponíveis. capítulo 6: estudo exploratório 93 conclui-se também que, e como seria de esperar, existem evidências estatísticas de que o nível de conhecimento é significativamente diferente após consulta e análise do sítio web; contudo, só se verificam essas diferenças após a experiência com a aplicação de visualização de light fields, quando o grupo de indivíduos tem conhecimentos na área da computação gráfica. capítulo 7 7. conclusões e perspectivas de desenvolvimento neste trabalho foi apresentado um estudo da técnica light fields e da sua fundamentação teórica. foram apresentados conceitos sobre a luz e iluminação e deduzida a equação da radiância, concluindo-se que esta não tem solução analítica geral. deste modo foram analisados diversos pressupostos para a sua simplificação e as soluções apresentadas por investigadores da área. com base neste estudo foram apresentados os métodos principais de image based rendering baseados nas diversas técnicas de simplificação propostas. a técnica dos light fields utiliza, como dados de entrada, múltiplas vistas de uma cena e consiste em armazenar e processar a luz que é irradiada da cena. o processo consiste em capturar a luz que chega da cena. a condição de luz de uma cena pode ser caracterizada através da dimensão 5 da plenoptic function que descreve o fluxo de luz (radiância) em cada ponto no espaço de dimensão 3 em qualquer direcção (2 graus de liberdade). no entanto, assumindo um objecto limitado e um espaço livre, a radiância não muda ao longo de uma linha de vista, reduzindo o espaço de dimensão 5 a um espaço de dimensão 4. este tipo de técnica envolve diversos aspectos matemáticos e físicos que apresentam alguma dificuldade de compreensão. de modo a permitir uma melhor compreensão do conceito de light fields foi projectada e implementada uma aplicação didáctica composta por uma aplicação de visualização em ambiente windows de lfs e um sítio web. a aplicação desenvolvida foi utilizada no ensino rápido do conceito a indivíduos com bons conhecimentos de informática e distintos conhecimentos na área da computação gráfica. o inquérito realizado no âmbito deste trabalho permitiu concluir que, num espaço de tempo muito reduzido, utilizadores com bons conhecimentos em informática, incrementaram significativamente os seus conhecimentos relativos a todos os conceitos relacionados com a técnica dos light fields. foi concluído com um nível de capítulo 7: conclusões e perspectivas de desenvolvimento 96 significância de 0.05 que os utilizadores, após uma breve análise do sítio web, aumentaram os seus conhecimentos relativamente a todos os (sete) conceitos apresentados. foi também concluído que os utilizadores aumentaram posteriormente os seus conhecimentos relativamente ao conceito de light field e ao funcionamento dos planos uv e st após a utilização da aplicação de visualização. uma conclusão interessante decorrente da investigação realizada neste trabalho é que, apesar de terem sido fornecidos conceitos teóricos a indivíduos com bons conhecimentos na área da informática e de estes terem compreendido alguns conceitos, só o grupo com significativa experiência em computação gráfica é que viu o seu nível de conhecimento aumentar significativamente após experiência com a aplicação de visualização de lfs. na realidade, este grupo viu os seus conhecimentos aumentarem significativamente relativamente ao conceito de “plenoptic function”, “light field” e “planos uv e st”, enquanto que no grupo com bons conhecimentos de informática mas fracos conhecimentos em cg não se observou este fenómeno (pelo menos com um nível de significância estatisticamente válido). deste modo pode-se concluir que a aplicação desenvolvida é apropriada sobretudo a indivíduos com alguns conhecimentos em computação gráfica, grupo aliás a que a mesma era originalmente destinada. relativamente às perspectivas futuras de desenvolvimento deste trabalho, fica em aberto o recurso às actividades presentes no sítio web, que poderiam ser alargadas para que os utilizadores interligassem conceitos teóricos e práticos. embora o sítio web apresente diversas actividades apropriadas, o desenvolvimento de actividades extra, nomeadamente no que diz respeito aos conceitos de image based rendering e light fields seria de extrema utilidade. a aplicação de visualização de lfs tem características que podem ser dilatadas, de modo a poder ser possível acrescentar componentes mais específicas e teóricas, de forma a tornar mais fácil o acesso a todo o tipo de indivíduos. a adição de operações didácticas extra de manipulação de light fields, por exemplo de manipulação interactiva dos planos uv e st, poderia incrementar o potencial de utilização da aplicação, sobretudo para utilizadores com menores conhecimentos de computação gráfica. o estudo estatístico também poderia ser direccionado para uma linha de investigação mais abrangente na área da didáctica multimédia relacionada não só com tópicos complexos na área da computação gráfica mas também em outras áreas. o desenvolvimento de outras aplicações didácticas que permitam o ensino de conceitos complexos, complementado por estudos estatísticos apropriados relativos à compreensão e consolidação de conhecimentos, assume-se, neste contexto, como uma linha de investigação futura promissora. 97 referências bibliográficas [adelson e bergen, 1991] adelson, e. h., bergen, j. r., “the plenoptic function and the elements of early vision”, computational models of visual processing, cambridge, ma: mit press, 1991 [ahrenberg e magnor, 2006] ahrenberg, l., magnor, m. “light field rendering using matrix optics”, journal of winter school of computer graphics (wscg), 14th international conference in central europe on computer graphics, visualization and computer vision, pp. 177-184, república checa, janeiro 2006 [apple, 2007] apple inc., “quick time vr”. disponível em: http://www.apple.com /quicktime/ technologies/ qtvr/ [consultado em setembro de 2007] [baumgartner e hafele, 2004] baumgartner, p., hafele, h., “content management systeme in e-education”, auswahl, potenziale und einsatzmoglichkeiten. innsbruck- wien, studienverlag, 2004 [bloom, 1956] bloom, b. s., “taxonomy of educational objectives: book 1, cognitive domain”, new york, longman, 1956 [borman e stevenson, 1998] borman, s., stevenson, r. l., “super-resolution from image sequences – a review”, midwest symposium on circuits and systems, 1998 [buehler, 2001] buehler, c., bosse, m., mcmillan, l., gortler e cohen, m., “unstructured lumigraph rendering”, computer graphics, special interest group on graphics and interactive techniques (siggraph’01), pp. 425-432, agosto 2001 [camahort et al., 1999] camahort, e., fussel, d., “a geometric study of light field representations”, technical report tr-99-35, department of computer science, university of texas, austin, 1999 [carlson, 2007] carlson, w., “a critical history of computer graphics and animation”. disponível em: http://design.osu.edu/carlson/history [consultado em julho de 2007] [chai et al., 2000] chai, j. x., tong, x., chan, s. c. e shum, h. y., “plenoptic sampling”, computer graphics, special interest group on graphics and interactive techniques (siggraph’00), pp. 307-318, julho 2000 [chan et al., 2003] chan, s. c., ng, k. t., gan, z. f., chan. k. l. e shum. h. y., “the data compression of simplified dynamic light fields”, international conference on acoustics, speech and signal processing (icassp’03), hong kong, abril 2003 [chen, 1995] chen, s. e. “quicktime vr – an image-based approach to virtual environment navigation”, computer graphics special interest group on graphics and interactive techniques (siggraph’95), agosto 1995 referências bibliográficas 98 [chen, 2006] chen, b., “novel methods for manipulating and combining light fields”, standford university, 2006 [cohen et al., 1993] cohen, m., wallace, j., “radiosity and realistic image sintesis”, academia press professional, harcourt brace et company, publishers, pp. 13-40, 1993 [dansereau, 2003] dansereau, d., “4d light field processing and its application to computer vision”, calgary university, 2003 [dreamweaver, 2007] dreamweaver “adobe systems - dreamweaver”. disponível em: http://www.adobe.com/products/dreamweaver/ [consultado em setembro de 2007] [faria et al., 2007] faria, b.; costa, j.; marques, e., matos, v. “os gráficos”, faculdade de ciências da universidade do porto, 2003 [foley et al., 1990] foley, j. van dam, a., feiner, s., hudges, j. “computer graphics: principles and practice”, 2nd edition, addison-wesley publishing company, 1990 [foote e kimber, 2000] foote, j. e kimber, d., “flycam: pratical panoramic video”, international conference on multimédia&expo (icme’00), agosto 2000 [fosnot, 2000] fosnot, c. t., “construtivismo e educação – teorias, perspectivas e práticas”, instituto piaget, novos horizontes, 2000 [gesho e gray, 1992] gesho, a., gray, r., “vector quantization and signal compression”, kluwer academia publishers, 1992 [gilbert e boulter, 1998] gilbert, j. k., boulter, c. j., “aprendendo ciências através de modelos e modelagem”, colinvaux, d. ed. modelos e educação em ciências, pp. 12- 34, 1998 [girod et al., 2003] girod, b., chang, c. l., ramanathan, p. e xiaoqing zhu, “light field compression using disparity compensated lifting”, international conference on acoustics, speech and signal processing icassp’03, hong kong, china, abril 2003 [glasersfeld, 1996] glasersfeld, e. v., “construtivismo radical”, instituto piaget, isbn: 9728329687, 1996 [glut, 2005] glut, “glut – the opengl utility toolkit”. disponível em: http://www.opengl.org/resources/libraries/glut/ [consultado em janeiro de 2005] [gomes, et al., 2006] gomes, t. ferracioli, l. “a investigação da construção de modelos no estudo de um tópico de física utilizando um ambiente de modelagem computacional qualitativo”, revista brasileira de ensino de física, vol. 28 n. 4, são paulo, issn: 0102-4744, 2006 [gortler et al., 1996] gortler, s. j., grzeszczuc, r., szeliski, r. e cohen, m. f., “the lumigraph”, computer graphics (siggraph’96), pp. 43-54, agosto 1996 [gouraud, 1971] gouraud, h, “continuous shading of curved surfaces”, institute of electrical and electronics engineers (ieee) transactions on computers, pp. 623-628, 1971 [gu et al., 1997] gu, x., gortler, s., cohen, m., “polyhedral geometry and the two- plane parameterization”, 8th eurographics worshop on rendering, pp.1-12, 1997 referências bibliográficas 99 [hammond, 1993] hammond, n. “learning with hypertext: problems, principles and prospects”. disponível em: http://telecaster.lboro.ac.uk/happ/chapter4.html [consultado em janeiro de 2003] [hill et al., 2005] hill, m. m., hill, a., “investigação por questionário”, edições sílabo, lda, 2ª edição, lisboa, 2005 [ihm et al., 1997] ihm, park, s., lee, r. k., “rendering of spherical light fields”, proceedings pacific graphics’97, 1997 [issing, 1994] issing, l. j. “from instructional technology and multimedia didactics”, educational media international, vol. 31, no 3, pp. 171-182, 1994 [issing, 2003] issing, l. j. “conceitos básicos da didáctica para multimedia”. disponível em: http://penta.ufrgs.br/edu/teleduc/tdidmult.htm [consultado em janeiro de 2003] [jank e meyer, 1994] jank w. e meyer h., “didaktische modelle”, cornelsen scriptor, berlim, 1994 [jensen, 1996] jensen, h.w., “global ilumination using photon maps”, in proceedings of the seventh eurographics workshop on rendering, springer, ny, pp. 21-30, 1996 [jonasson, 1991] jonasson, “instrutional design and learning theory”. disponível em: http://www.usask.ca/education/coursework/802papers/mergel/brenda.htm [consultado em outubro de 2007] [kang e shum, 2000] kang, s.s., shum, h.y., “a review of image based rendering techniques”, institute of electrical and electronics engineers, inc, ieee/spie visual communications and image processing (vcip) 2000, pp. 2-13, junho 2000 [kawasaki et al., 2001] kawasaki, h., ikeuchi, k., sakauchi, m., “light field rendering for large-scale scenes”, ieee computer society conference on computer vision and pattern recognition, volume 2, pp. 64-76, 2001 [kernighan, 1978] kernighan, b. w., plauger, “the elements of programming style” 2ª edição, mcgraw hill, new york, 1978 [kernighan e ritchie, 1978] kernighan b. e ritchie d., “the c programming language”, englewood cliffs, n.j., prentice hall, 1978 [klafki, 1974] klafki, w, “curriculum – didaktik”, wulf, pp. 117-128, 1974 [kozma, 1991] kozma, r., “learning with media. review of educational research”, 61 (2), pp. 179-211, 1991 [lalonde e fournier, 1999] lalonde, p., fournier, a., “interactive rendering of wavelet projected light fields”, graphics interface 1999, kingston, ontario, canada, pp.107- 114, setembro 1999 [lensch, 1999] lensch, h., heidrich, w., cohen, m. f., seidel, h.-p., “light field techniques for reflections and refractions”, in eurographics rendering workshop, junho 1999 referências bibliográficas 100 [leung e chen, 2002] leung, w. h. e chen, t., “line-space representation and compression for image-based rendering”, carnegie mellon university, technical report: amp01-02, 2002 [levoy, 1996] levoy, m., “lightpack: light field authoring and rendering package”. disponível em: http://graphics.stanford.edu/software/lightpack/lightpack.html [consultado em setembro de 2003] [levoy e hanrahan, 1996] levoy, m. e hanrahan, p.; “light field rendering”, computer graphics (siggraph’96), pp. 31-42; agosto 1996 [liang et al., 2007] liang, c.k., liu, g.e chen, h. h., “light field acquisition using programmable aperture camera”, ieee international conference on image processing, charleston, abril 2007 [lin e shum, 2000] lin, z. c. e shum, h. y., “on the number of samples needed in light field rendering with constant-deph assumption”, computer vision and pattern recognition (cvpr’00), hilton head island, south carolina, usa, junho 2000 [luo et al., 2000] luo, l., wu, y., li, j.e zhang, y., “compression of concentric mosaic scenery with aligment and 3d wavelet transform”, spie: image and video communications and processing 2000, san jose ca, pp. 89-100, january 2000 [magnor et al., 2000a] magnor, m. e girod, b., “data compression for light field rendering”, ieee transactions on control system test vehicle (cstv), vol.10, no.3, abril 2000 [magnor et al., 2000b] magnor, m. e girod, b., “model-based coding of multi- viewpoint imagery”, visual communications and image processing (vcip’00), perth, australia, junho 2000 [mager, 2005] mager, r., “preparing instructional objectives – a critical tool in the development of effective instrution”, 3ª edição, 2005 [mcmillan e bishop, 1995] mcmillan, l.; bishop, g.; “plenoptic modeling: an image- based rendering system”, computer graphics special interest group on graphics and interactive techniques (siggraph’05), pp 39-46, agosto 1995 [miller et al., 1998] miller g., rubin s.e ponceleon d., “lazy decompression of surface light fields for precomputed global illumination”, eurographics rendering workshop 1998, viena, austria, junho 1998 [mitchell et al., 1996] mitchell, j.l., pennebaker, w. b.,fogg, c. e., legall, d. j., “mpeg video: compression standard”, chapman & hall, 1996 [nayar, 1997] nayar, s., “catadioptric omnidirectional camera”, computer vision and pattern recognition (cvpr’97), porto rico, pp. 482-488, junho 1997 [ng 2001] ng, t., chan, s. c., shum, h.y., “scalable coding and progressive transmission of concentric mosaic using nonlinear filter banks”, international conference on image processing (icip’01), thessaloniki, outubro 2001 [ng, 2006] ng, r., “digital light field photography”, standford university, 2006 referências bibliográficas 101 [ohly, 2004] ohly, p., “extended light fields”. disponível em: http://www.estamos.de/projects/lightfieds/ [consultado em janeiro 2004] [ohm, 1994] ohm, j. r., “three-dimensional subband coding with motion compensation”, ieee transactions on image processing, vol. 3, no. 5, pp. 559-571, setembro 1994 [opengl, 2005] opengl, “the industry’s foundation for high performance graphics”. disponível em: http://www.opengl.org/ [consultado em janeiro de 2005] [peleg, 1997] peleg s., herman j., “panoramic mosaics by manifold projection”, computer vision and pattern recognition (cvpr’97), washington, pp. 338-343, junho 1997 [peleg, 2000] peleg s., rousso b., rav-acha a., zomet a., “mosaicing on adaptive manifolds”, ieee transactions on pattern analysis and machine intelligence (pami), vol. 22 no. 10, pp. 1144-1154, outubro 2000 [peter e straber, 1999] peter i., e straber w., “the wavelet stream - progressive transmission of compressed light field data”, ieee visualization, san francisco, ca., 1999 [pintrich, 2002] pintrich, p.r., “the role of goal orientation – motivation in education: theory, research and applications”, 2ª edição, englewood cliffs, nj: prentice hall, pp. 190-242, 2002 [ramanathan, 2005] ramanathan, p., “compression and interactive streaming of light fields”, standford university, 2005 [reigeluth, 1991] reigeluth, c. m., “reflections on the implications of constructivism for educational technology”, educational technology, vol. 31, nº 9, pp. 34-37, 1991 [reigeluth, 1992] reigeluth, c. m., “the imperative of systematic change”, educational technology, vol. 32, nº 11, pp. 9-13, 1992 [reis, 2001] reis, e.; mondrian, p., “estatística multivariada aplicada”, 2ª edição revista e aumentada, edições sílabo, isbn: 972 618-247-6, lisboa, 2001 [sgi, 2005] silicon graphics, “sgi-innovation for results”. disponível em: http://www.sgi.com/ [consultado em janeiro de 2005] [shum e he, 1999] shum, h.y, he, l. w., “rendering with concentric mosaics”, computer graphics special interest group on graphics and interactive techniques (siggraph’99), agosto 1999 [shirley et al., 1995] shirley, p.; wade, b., hubbard, p. m., zareski, d., walter, b., greenberg, d. p., “global illumination via density-estimation”, in proceedings of the 6th eurographics workshop on rendering”, edited by hanrahan and purgathofer, springer-verlag, pp. 219-230, june 1995 [shum et al., 2000] shum h. y., ng k.t.e chan s. c., “virtual reality using the concentric mosaic: construction, rendering and data compression”, international conference on image processing (icip’00), vancouver, canada, setembro 2000 referências bibliográficas 102 [shum et al., 2001] shum h. y., li j.e zhang y., “on the compression of the image based rendering scene: a comparison among block, reference and wavelet coders”, internacional journal on image and graphics, vol. 1, no. 1, pp. 45-61, 2000 [shum et al., 2001b] shum, h. y., ng, k.t., chan, s. c.e kang, s. b., “on the data compression and transmission aspects of panoramic video”, international conference on image processing (icip’01), thessaloniki, grécia, outubro 2001 [shum, 2002] shum h. y., wang l. f., chai j. x. e tong x., “rendering with manifold hopping”, international journal of computer vision, pp. 644-647, novembro 2002 [slater, 2000] slater, m. “tutorial on light field rendering”, seoul, korea, pp.35-53, outubro 2000 [sloan, 1997] sloan, p., “time critical lumigraph rendering”, in proceedings of the 1997 symposium on interactive 3d graphics, acm, rhode island, usa, pp. 17-29, 1997 [spss, 2007] spss inc., “spss, data mining, statistical analysis software, predictive analysis”. disponível em: http://www.spss.com/ [consultado em setembro de 2007] [stroustrup, 1994] stroustrup b., “the design and evolution of c++”, addison- wesley, isbn 0-201-54330-3, 1994 [szeliski, 1994] szeliski, r., “image mosaicing for tele-reality applications”, technical report crl94/2, dec cambridge research lab, maio 1994 [szeliski e shum, 1997] szeliski, r., shum, h. y., “creating full view panoramic image mosaic and texture mapped models”, computer graphics special interest group on graphics and interactive techniques (siggraph’97), pp. 251-258, agosto 1997 [taubman e zakhor, 1994] taubman d. e zakhor a., “multirate 3-d subband coding of video”, ieee transactions on image processing, vol. 3, no. 5, pp. 572-588, setembro 1994 [taubman e marcellin, 2001] taubman d. e marcellin m., “jpeg2000: image compression fundamentals, standards e practice”, kluwer academic publisher, novembro 2001 [tennyson e nielsen, 1998] tennyson, r. d. e nielsen, m., “complexity theory: inclusion of the affective domain in an interactive learning model for instructional design”, educational technology, vol. 38, nº 6, pp. 7-12, 1998 [tham et al., 1998] tham j. y., ranganath s., e kassim a. a., “highly scalable wavelet-based video codec for very low bit-rate environment”, ieee journal on selected areas in communications, vol. 16, nº 1, janeiro 1998 [tuckman, 2002] tuckman, b. w., “manual de investigação em educação: como conceber e realizar o processo de investigação em educação”, lisboa: fundação calouste gulbenkian, 2002 [visual studio, 2007] visual studio, “visual studio developer center”. disponível em: http://msdn2.microsoft.com/pt-br/vstudio/ [consultado em setembro de 2007] referências bibliográficas 103 [watson, 1913] watson, j. b., “psychology as the behaviorist views it”, psychological review, nº20, pp. 158-177, 1913 [wilburn et al., 2002] wilburn, b., smulski, m., lee, h. k. e horowitz, m., “the light field video camara”, proceedings of media processors 2002, society of photographic instrumentation engineers (spie) electronic imaging 2002 [windowsxp, 2007] windowsxp, “microsoft windows xp home edition”. disponível em: http://www.microsoft.com/ windowsxp/home/ [consultado em setembro de 2007] [wood et al., 1997] wood, d. n., finkelstein, a., hudges, j. f., thayer, c. e. e salesin, d. h., “multiperspective panoramas for cell animation”, computer graphics (siggraph’97), pp. 243-250, agosto 1997 [wood et al., 2000] wood, d., azuma, d., aldinger, k., curless, b., duchamp, t., salesin, h., “surface light fields for 3d photography”, computer graphics (siggraph’2000), acm press, addison wesley longman, edited by kurt akeley, pp. 287-296, julho 2000 [whitted, 1980] whitted, t. “an improved illumination model for shaded display”, in communications of the acm, vol. 23, pp. 343-349, 1980 [w3schools, 2007] w3schools, “w3shools – the best things in life are free”. disponível em: http://www.w3schools.com/xhtml/xhtml_summary.asp [consultado em setembro de 2007] [yang et al., 2002] yang, j. c., everett, m., buehler, c. e mcmillan, l., “a real-time distributed light field camera”, eurographics workshop on rendering, 2002 [zhang e li, 2000] zhang, c.e li, j., “compression and rendering of concentric mosaics with reference block codec (rbc)”, visual communications and image processing (vcip’00), perth, australia, junho 2000 [zhang e chen, 2003] zhang, c., chen, t.; “spectral analysis for sampling image- based rendering data”, ieee transactions on control system test vehicle (csvt), special issue on image-based modeling, rendering and animation, 2003 anexo 1- questionário sobre light fields questionário --1/4-- light fields o objectivo deste inquérito é recolher informação sobre a percepção e aprendizagem do utilizador enquanto observador de cenas tridimensionais com diferentes parâmetros associados. a informação que irá fornecer contribuirá para que seja possível retirar conclusões no estudo para a tese “light fields: aplicação didáctica de criação de novas vistas a partir de múltiplas imagens”, no âmbito do mestrado em tecnologia multimédia da feup. instruções de preenchimento: -para responder às questões fechadas clique sobre o quadrado da opção pretendida. -para responder às questões abertas clique sobre o espaço a sombreado e escreva o texto. -siga as instruções que encontrará no decorrer do questionário. 1. identificação do inquirido 1.1. idade 1.2. sexo m f 1.3. habilitações literárias até ao 12º ano de escolaridade curso técnico-profissional bacharelato licenciatura mestrado doutoramento 1.4. profissão 2. utilização do computador nas aplicações gráficas nenhum pouco algum bastante muito 2.1. conhecimentos em computação gráfica 2.2.experiência com programas de visualização de imagens 2.3. experiência em modelação gráfica 2.4. conhecimento do conceito de imaged based rendering 2.5. conhecimento do conceito light field (lf) questionário --2/4-- no final do questionário vai ser pedido o tempo que demorou a responder às questões, por isso registe essa informação. hora de início: 3. compreensão de conceitos i nenhum pouco algum bastante muito 3.1. compreensão do conceito de luz 3.2.compreensão do conceito de iluminação 3.3. compreensão do conceito de radiância 3.4. compreensão de image based rendering 3.5. compreensão da plenoptic function 3.6. compreensão do conceito de light field 3.7. entendimento do funcionamento dos planos uv e st em lfs nas afirmações do ponto 3 que respondeu ter pelo menos pouco conhecimento diga o que entende por: luz: iluminação: radiância: image based rendering: plenoptic function: light fields: funcionamento dos planos uv e st em lfs: siga as instruções antes de responder aos próximos blocos de questões: - analise os conceitos apresentados no sítio web http://www.fe.up.pt/~lpreis/lf/ e depois responda às questões: questionário --3/4-- 4. compreensão de conceitos ii nenhum pouco algum bastante muito 4.1. compreensão do conceito de luz 4.2.compreensão do conceito de iluminação 4.3. compreensão do conceito de radiância 4.4. compreensão de image based rendering 4.5. compreensão da plenoptic function 4.6. compreensão do conceito de light field 4.7. entendimento do funcionamento dos planos uv e st em lfs descarregue o programa “aplicação didáctica de lf, disponível em: http://www.fe.up.pt/~lpreis/lf/app.zip”. experimente visualizar os três lf’s disponíveis, rodando-os e movimentando-os, utilizando os botões do rato (esq – rotação, dir – movimentação, esq+dir – zoom). analise, agora, os parâmetros apresentados nos menus: zoom, planos e refinamento. no lf do leão experimente uma rotação de 360º com a opção “ver plano” activa de modo a verificar a transição dos planos. 5. compreensão de conceitos iii nenhum pouco algum bastante muito 5.1. compreensão do conceito de luz 5.2.compreensão do conceito de iluminação 5.3. compreensão do conceito de radiância 5.4. compreensão de image based rendering 5.5. compreensão da plenoptic function 5.6. compreensão do conceito de light field 5.7. entendimento do funcionamento dos planos uv e st em lfs (após ver as descontinuidades na transição dos pares de planos) questionário --4/4-- 6. conceito de light field nenhum pouco algum bastante muito 6.1. entendimento sobre o funcionamento do site e da aplicação 6.2. compreensão da inserção do conceito de light field na aplicação 6.3 interesse da técnica de lfs responda resumidamente: conceito de light fields: funcionamento dos planos uv e st em lfs: apreciação geral da técnica light field: outros comentários ☺: tempo que demorou a preencher o questionário: envie o questionário preenchido para: moni.faria@gmail.com obrigada pela colaboração!