síntese de imagem baseada em light fields:
concepção e desenvolvimento de uma aplicação didáctica
brígida mónica teixeira de faria
faculdade de engenharia da universidade do porto
departamento de engenharia electrotécnica e de computadores
rua roberto frias, s/n, 4200-465 porto, portugal
dezembro de 2007
síntese de imagem baseada em light fields:
concepção e desenvolvimento de uma aplicação didáctica
brígida mónica teixeira de faria
licenciada em matemática pela faculdade de ciências da
universidade do porto
dissertação realizada no âmbito do mestrado em tecnologia
multimédia da faculdade de engenharia da universidade do porto,
orientada pelo professor doutor antónio augusto de sousa.
faculdade de engenharia da universidade do porto
departamento de engenharia electrotécnica e de computadores
rua roberto frias, s/n, 4200-465 porto, portugal
dezembro de 2007
resumo
o desenvolvimento praticado na área de computação gráfica permitiu aspirar pela
modulação de cenas sem recurso aos dados concretos sobre a geometria da mesma.
vários métodos foram criados e aplicados por diversos investigadores, sendo de realçar
os métodos de light fields e lumigraph. este trabalho apresenta o percurso efectuado
pela comunidade científica para se conseguir atingir este patamar de investigação, na
qual se insere a técnica de image based rendering analisada: os light fields.
para compreender a técnica light field foi essencial contextualizá-la apresentando
conceitos físicos e matemáticos que permitiram justificar os pressupostos de
simplificação da plenoptic function. esta função traduz o mundo observável, sendo a
sua dimensão composta por sete variáveis. deste modo são compreensíveis os caminhos
alternativos que foram criados para simplificar e reduzir o seu número de variáveis.
com a utilização da parametrização da técnica de light fields, foi possível atingir a
dimensão quatro para esta função. a diminuição do número de variáveis implica
algumas desvantagens, na medida em que a qualidade da imagem, flexibilidade e
realismo são também reduzidas. contudo, a diminuição da qualidade poderá não ser um
obstáculo para a utilização da técnica dos light fields, desde que os fins a atingir não
necessitem de uma elevada qualidade de imagem. no trabalho é ainda apresentado um
estudo teórico de light fields: a definição, a geometria básica necessária, a descrição
das parametrizações possíveis e dos planos utilizados.
o conhecimento da técnica dos light fields não é intuitivo e é pouco explorado pela
comunidade científica ligada à computação gráfica. com base nesta constatação
pretendeu-se investigar se seria possível, através da criação de um sítio web e do
desenvolvimento de uma aplicação de visualização de light fields, transmitir, de modo
eficiente, o conhecimento teórico e prático da técnica a indivíduos com bons
conhecimentos de informática. a investigação baseou-se no pressuposto de que o
progresso da multimédia e a sua utilização em aplicações didácticas são fortes aliados
para o incremento dos conhecimentos e aceleração do processo de aprendizagem, na
medida em que através de imagens, hipertexto, gráficos e vídeos, entre outros, se
obtém uma maior exploração dos conceitos e aumento da motivação dos utilizadores.
na construção do sítio web foi prevista a aplicação destes elementos multimédia e, ao
introduzir este modo de divulgação de conhecimento, foi previamente estabelecido o
modelo educacional a utilizar, sabendo à partida, que o utilizador seria, em grande parte,
autónomo no processo de aprendizagem. o desenvolvimento da aplicação de
visualização de light fields foi realizado usando como base componentes criados
previamente por marc levoy e pat hanrahan na universidade de stanford, auxiliando a
enriquecer a componente didáctica do sistema.
a vertente didáctica de divulgação da técnica dos light fields foi alvo de estudo através
da realização de um inquérito tendo em vista a pesquisa de informação sobre o nível de
conhecimento adquirido por utilizadores, com diferentes conhecimentos de computação
gráfica, após a análise do sítio web e aplicação de visualização. o estudo procurou
obter informação adicional sobre as características do utilizador e o nível de
desenvolvimento das suas competências após a aprendizagem dos conceitos
averiguando a diferença no processo de aprendizagem para indivíduos com e sem bases
na área de computação gráfica. uma série de dados foi retirada, analisada, utilizando a
ferramenta spss, e aplicando a teoria subjacente à estatística inferencial, em particular,
aos testes de hipóteses, de forma a ser possível a obtenção de evidências estatísticas
quanto às melhorias notadas num conjunto de utilizadores que tiveram contacto com o
sítio web e aplicação de visualização dos light fields.
os resultados obtidos permitem concluir que o nível de conhecimento sobre light
fields aumentou após o acesso ao sítio web. apesar de esta conclusão ser
relativamente esperada à partida, foi de certo modo interessante verificar que o grupo de
indivíduos com conhecimentos em computação gráfica (cg) beneficiou e
compreendeu muito melhor os conceitos após a utilização da aplicação de visualização
do que o grupo sem conhecimentos nesta área. na realidade, o grupo sem
conhecimentos em computação gráfica viu os seus conhecimentos aumentarem
significativamente relativamente ao conceito de light field e outros conceitos
directamente associados enquanto que no grupo com bons conhecimentos de
informática mas fracos conhecimentos em cg não se observou este fenómeno com um
nível de significância estatisticamente válido, concluindo-se que a aplicação
desenvolvida é apropriada, sobretudo, a indivíduos com conhecimentos em computação
gráfica, grupo para o qual a mesma era originalmente destinada.
abstract
the recent developments in the computer graphics area enabled to aspire developing
scene modeling without its concrete geometric data. several methods were developed
and applied by distinct researchers in the field with emphasis on light fields and
lumigraph methods. this work presents the scientific community research to achieve
this research goal in which the analyzed image based rendering technique of light
fields is included.
in order to fully understand light fields it was necessary to contextualize this technique
and to present its main physical and mathematical concepts that enable to justify the
plenoptic function simplifying conditions. this function translates the observable world
in a seven dimensional function. in this way it is possible to understand the alternative
ways to simplify this function reducing its number of variables. with the use of light
fields it was possible to reduce to four the number of variables. however, this reduction
implies also some disadvantages such as the reduction of the image quality, flexibility
and realism. depending on the desired image quality of the application this may or may
not be a serious disadvantage. in the work it is also presented a theoretical study of
light fields from its definition, necessary basic geometry, possible parameterizations
and image planes used.
the light field technique knowledge is not intuitive and as such it is not deeply
explored by the computer graphics scientific community. having this conclusion as
basis a study was developed in order to investigate the possibility of efficient
knowledge transmition, of this technique, to users with good knowledge in computer
science, by using a web site and an associated light fields visualization application.
the research was based on the idea that multimedia progress and its use in didactic
applications are strong allies to the knowledge increase and learning process
acceleration, by using images, hypertext, graphics and videos, among other, in order to
achieve deeper concept exploration and increased motivation. the web site was built
having in consideration this concerns and using an educational model based on user
autonomous learning. the light field visualization application was based on
components created by marc levoy and pat hanrahan at the university of stanford,
enabling to increase the autonomous didactic potential of the global system.
the light fields didactic component was investigated through an inquiry aiming to
research the knowledge increase achieved by users with previous good knowledge in
computer science and distinct level of expertise in computer graphics after analysing the
web site and the associated visualization application. the data gathered was analysed
using spss tool applying the underlying inferential statistics and hypotheses test
methodologies, in order to understand the knowledge evolution of the users after
analysing the web site and application.
the results achieved enable to conclude that the global level of knowledge about light
fields and all related concepts increased after a short period of study of the web site.
although this conclusion was expected, it is somewhat surprising to verify that the
group with good knowledge in computer graphics could benefit and learn a lot more
than the group with reduced knowledge on this area, by using the light field
visualization application. this enables to take the conclusion that the developed
multimedia learning system is appropriate for individuals with good knowledge in
computer graphics as it was its original objective.
aos meus pais,
pedro,
filipe,
e luís.
com amor e carinho…
agradecimentos
na elaboração deste trabalho foram vários os que contribuíram para que fosse possível
atingir o fim desta dissertação.
em primeiro lugar, agradecer ao professor doutor a. augusto de sousa pela proposta
deste tema, pela dupla função de orientador e conselheiro na execução do trabalho e por
me ter sempre procurado proporcionar as melhores condições na execução do mesmo.
gostaria também de lhe agradecer pelas excelentes aulas de sistemas gráficos
interactivos, que me despertaram o interesse pela área da computação gráfica e me
motivaram à realização desta tese.
recordo também que a ajuda do nuno lau foi fundamental para a instalação e execução
inicial do programa e a contribuição do joão paredes e carlos campos que me
permitiram aprender rapidamente os comandos base em linux. agradeço também à
kajal ratanji pelos conselhos em termos de design, cor e adequação dos elementos
multimédia.
a palavra obrigada vai ao encontro do professor doutor eurico carrapatoso, na
qualidade de director de mestrado, que esclareceu as dúvidas perante a organização do
mestrado em tecnologia multimédia e a todos os professores que leccionaram as
disciplinas do primeiro ano, que contribuíram, sem dúvida, para o enriquecimento dos
meus conhecimentos na área da multimédia. o modo como estruturaram o plano de
estudos permitiu que alunos de diferentes formações de base interligassem e
partilhassem saberes.
queria agradecer ao pedro pela paciência, pela leitura do trabalho, pela identificação,
análise e esclarecimento das mais valias do trabalho e, enfim, pelos conselhos e
preocupações de irmão mais velho. ao filipe que sempre esteve presente para tudo o
que era preciso, não hesitando em ajudar. aos meus pais que conseguiram transmitir os
valores que tornam, em grande parte, aquilo que sou hoje e que está reflectido nas linhas
que constituem o presente trabalho.
palavras para ti, luís, não são suficientes, mas estariam todas ao mais alto nível! pela
leitura do trabalho, pela motivação (quando mais precisei), pelo rumo dado e pela
partilha do entusiasmo científico e não só…
índice ix
índice
1. introdução 1
1.1 enquadramento e motivação...............................................................................................1
1.2 objectivos............................................................................................................................2
1.3 estrutura da dissertação......................................................................................................3
2. equação de radiância 5
2.1 luz.......................................................................................................................................6
2.2 pressupostos de simplificação ............................................................................................9
2.2.1 independência do comprimento de onda.....................................................................9
2.2.2 tempo invariante..........................................................................................................9
2.2.3 transporte de luz em espaço livre ..............................................................................10
2.2.4 objectos são isotrópicos .............................................................................................10
2.3 radiância...........................................................................................................................10
2.4 reflexão ............................................................................................................................13
2.5 equação de radiância .......................................................................................................15
2.6 soluções da equação de radiância ...................................................................................16
2.6.1 flat-shaded graphics.................................................................................................18
2.6.2 real-time graphics....................................................................................................18
2.6.3 ray tracing.................................................................................................................18
2.6.4 monte carlo path tracing..........................................................................................20
2.6.5 radiosity .....................................................................................................................20
2.6.6 monte carlo photon tracing......................................................................................21
2.7 cálculo de visibilidade .....................................................................................................22
2.8 o problema de iluminação em image based rendering...................................................23
2.9 sumário do capítulo..........................................................................................................23
3. image based rendering 24
3.1 plenoptic function ............................................................................................................25
3.2 restrição do espaço de vista ............................................................................................27
índice x
3.2.1 pressupostos para restringir o campo de vista .........................................................27
3.2.1.1 comprimento de onda .........................................................................................28
3.2.1.2 radiância constante.............................................................................................28
3.2.1.3 eliminação do tempo ..........................................................................................28
3.2.1.4 restrição aplicada ao movimento num plano.....................................................29
3.2.1.5 restrição aplicada ao movimento num caminho ...............................................30
3.2.1.6 observador numa posição fixa............................................................................30
3.3 representações e o processo de rendering.......................................................................30
3.3.1 surface plenoptic function.........................................................................................30
3.3.2 plenoptic modeling e light field video.....................................................................31
3.3.3 light fields e lumigraph ...........................................................................................31
3.3.4 concentric mosaics ....................................................................................................33
3.3.5 image mosaicing.........................................................................................................35
3.4 amostragem ......................................................................................................................36
3.5 compressão .......................................................................................................................37
3.6 sumário do capítulo..........................................................................................................40
4. light fields 41
4.1 definição e representação do light field ........................................................................42
4.2 geometria básica e sistema de coordenadas ...................................................................44
4.3 rendering: interpolação ....................................................................................................45
4.4 representações de light fields.........................................................................................49
4.5 mais desenvolvimentos no estudo dos light fields ........................................................51
4.6 sumário do capítulo..........................................................................................................52
5. aplicação didáctica de light fields 53
5.1 modelos educacionais.......................................................................................................54
5.2 interactividade e visualização...........................................................................................57
5.3 modelo da aplicação.........................................................................................................58
5.4 aplicação base utilizada – lightpack 1.0........................................................................60
5.4.1 introdução...................................................................................................................60
5.4.2 criação de um light field ..........................................................................................61
5.4.3 visualização de um light field..................................................................................61
5.4.4 arquitectura do sistema..............................................................................................61
índice xi
5.4.5 formato do ficheiro light field..................................................................................62
5.4.6 rendering (volvis e volpack) ....................................................................................64
5.5 aplicação didáctica de visualização................................................................................65
5.5.1 plataforma de desenvolvimento seleccionada...........................................................66
5.5.2 potencialidades requeridas ao sistema......................................................................67
5.5.3 interface gráfica da aplicação ...................................................................................68
5.6 sítio web didáctico ..........................................................................................................70
5.6.1 plataforma de desenvolvimento seleccionada...........................................................70
5.6.2 potencialidades requeridas ao sistema......................................................................71
5.6.3 interface gráfica da sítio web ...................................................................................72
5.7 sumário do capítulo..........................................................................................................74
6. estudo exploratório 75
6.1 metodologia e objectivos .................................................................................................75
6.2 população e amostra.........................................................................................................79
6.3 procedimentos ...................................................................................................................82
6.4 resultados obtidos............................................................................................................87
6.5 discussão e análise dos resultados..................................................................................92
7. conclusões e perspectivas de desenvolvimento 95
referências bibliográficas 97
anexo 1- questionário sobre light fields 104
lista de figuras xii
lista de figuras
figura 1: espectro electromagnético da radiação. .........................................................6
figura 2: radiância como o fluxo por unidade de área projectada por unidade de
ângulo sólido..................................................................................................................11
figura 3: fluxo entre duas superfícies elementares. .....................................................11
figura 4: direcção da reflexão caso a superfície seja especular................................13
figura 5: reflexão difusa: a luz radia num hemisfério à volta de um ponto da
superfície..........................................................................................................................14
figura 6: ilustração da equação de radiância. ...............................................................16
figura 7: imagem gerada utilizando ray tracing...........................................................19
figura 8: imagem gerada utilizando monte carlo path tracing................................20
figura 9: imagem gerada utilizando radiosity................................................................21
figura 10: paradigmas gbr e ibr. .......................................................................................25
figura 11: sistema de coordenadas da localização espacial e direcção de vista...26
figura 12: conjunto de 128 câmaras construído para o projecto inicial stanford
immersive television da universidade de stanford...............................................29
figura 13: parametrização do light field ........................................................................32
figura 14: processo de discretização dos planos uv e st. ..............................................33
figura 15: captura de concentric mosaic [shum e he, 1999].........................................33
figura 16: exemplo de um panorama utilizando image mosaicing...............................35
figura 17: representação discreta de um light field (um light slab)........................43
figura 18: sistema de coordenadas dos pontos nos planos uv e st. .............................45
figura 19: uma imagem é criada para cada ponto no plano st......................................46
figura 20: síntese de imagem para um novo ponto de vista............................................46
figura 21: utilização de texture mapping........................................................................47
figura 22: interpolação quadrilinear...............................................................................48
figura 23: o suporte para a base quadrilinear. ...............................................................49
figura 24: parametrizações do light field (à esquerda dois planos, no centro
parametrização esférica e à direita representação através de um ponto e uma
direcção). .........................................................................................................................50
lista de figuras xiii
figura 25: grau do controlo, síntese e envolvimento de conhecimento em
aprendizagem baseada na utilização do computador (adaptado de [hammond,
1993])..................................................................................................................................58
figura 26: nível de controlo, síntese e envolvimento do utilizador........................59
figura 27: exemplo de um cabeçalho do formato “.lif”. ................................................63
figura 28: exemplo de um segmento slab...........................................................................63
figura 29: esquema da interface gráfica da aplicação de visualização de light
fields.................................................................................................................................68
figura 30: interface do programa de visualização de light fields............................68
figura 31: visualização de uma rotação de 360º de um light field.............................69
figura 32: esquema do sítio web sobre light fields.......................................................73
figura 33: imagem da sessão sobre mais desenvolvimentos na área de light fields.
............................................................................................................................................74
figura 34: aspecto geral do questionário elaborado. ..................................................77
figura 35: interface do site da aplicação didáctica de light fields.........................78
figura 36: gráfico das percentagens das habilitações literárias da amostra. ......80
figura 37: gráfico das percentagens do sexo dos inquiridos. ......................................80
figura 38: diagrama esquemático do processo dos testes de hipóteses. ...................84
figura 39: diagrama esquemático da escolha dos testes de hipóteses......................85
lista de tabelas 1
lista de tabelas
tabela 1: frequência da idade dos indivíduos da amostra............................................79
tabela 2: tipo de conhecimentos em computação gráfica vs experiência com
programas de visualização de imagens.....................................................................81
tabela 3: nível de conhecimentos em computação gráfica. ........................................81
tabela 4: nível de conhecimento do conceito de ibr. ....................................................82
tabela 5: nível de conhecimento do conceito de light field.......................................82
tabela 6: evidências estatísicas quanto às diferenças do nível de conhecimento
após análise do sítio web. ............................................................................................87
tabela 7: frequência absoluta e relativa do nível de compreensão do conceito de
luz antes da análise do sítio web. .............................................................................88
tabela 8: frequência absoluta e relativa do nível de compreensão do conceito de
luz após análise do sítio web......................................................................................88
tabela 9: frequência absoluta e relativa do nível de compreensão do conceito de
light field. ......................................................................................................................88
tabela 10: frequência absoluta e relativa do nível de compreensão do conceito de
light field após análise do sítio web........................................................................89
tabela 11: evidências estatísicas quanto às diferenças do nível de conhecimento
experiência com o programa de visualização de lfs. ............................................90
tabela 12: evidências estatísticas quanto às diferenças do nível de conhecimento
após experiência com o programa de visualização de lfs em indivíduos sem
conhecimento em cg......................................................................................................91
tabela 13: evidências estatísicas quanto às diferenças do nível de conhecimento
após experiência com o programa de visualização de lfs em indivíduos com
conhecimento em cg......................................................................................................91
capítulo 1
1. introdução
1.1 enquadramento e motivação
a área da computação gráfica (cg) tem especial relevo e importância perante os
utilizadores e programadores de aplicações informáticas. a computação gráfica é um
subcampo da informática ou ciências da computação que está relacionada com a síntese
digital e manipulação de conteúdos visuais utilizando técnicas computacionais.
embora o termo computação gráfica se refira essencialmente a gráficos tri-
dimensionais, também abrange gráficos bidimensionais e processamento de imagem. a
computação gráfica inclui como subcampos: geometria, que estuda métodos de
representação e processamento digital de superfícies e objectos; animação, que estuda
métodos de representação e manipulação de superfícies que se movimentam e
deformam ao longo do tempo e síntese de imagem, que estuda métodos de reprodução
do transporte da luz e de geração de imagens a partir de modelos.
a computação gráfica iniciou-se na década de 60 com especial relevo para o trabalho
na universidade de utah (de salt lake city nos e.u.a.), com a apresentação de
alternativas no campo de desenho vectorial, representação tridimensional em ambientes
bidimensionais, mapeamento de texturas, entre outros princípios ainda que básicos, mas
que rapidamente atingiram desenvolvimentos evidentes na área. uma descrição
detalhada da evolução da computação gráfica pode ser encontrada em [carlson, 2007].
o progresso da computação gráfica foi introduzido nos ramos da engenharia, indústria
e entretenimento, sendo que a sua evolução partiu dos primeiros gráficos criados através
da linha de comandos até aplicações que vão além de gráficos vectoriais, ou seja,
utilização de imagens na criação de cenas tridimensionais.
há alguns anos, para se ter um equipamento capaz de executar software avançado de
cg era necessário uma plataforma silicon graphics ou equivalente, que não estava ao
capítulo 1: introdução 2
alcance de todos, bem como programas de animação que também não eram de fácil
acesso aos utilizadores em geral. nos dias correntes é possível o acesso aos principais
programas gráficos e de animação avançados, em plataformas de baixo custo como pcs,
o que torna ainda mais trivial o manejo, para aplicações não profissionais, que permitem
construir modelos e cenas tridimensionais, bem como construir e manipular os próprios
filmes de animação. os computadores pessoais (pcs) constituem hoje, na realidade, a
plataforma mais barata mas, ainda assim, bastante eficiente para a computação gráfica.
deste modo, praticamente todo o software de animação e visualização acabou por
migrar ou ter versões para a plataforma windows em pcs.
perante o facto da premente manifestação de aperfeiçoamento, o estudo desenvolvido
no âmbito deste trabalho vai ao encontro das principais novidades da área. se é possível
criar, através de computação gráfica, imagens de cenas tridimensionais, é também
importante o estudo da criação das cenas a partir de imagens retiradas da mesma. neste
âmbito, assumem particular relevância as técnicas de image based rendering e as
recentes metodologias baseadas em light fields que permitem a criação de cenas a
partir de múltiplas vistas de uma imagem. a motivação inicial para a realização deste
trabalho resulta então desta crescente importância. a evolução, os avanços efectuados e
trabalhos de investigação recentes vão na linha de utilização de imagens para a geração
de novas imagens na ausência, total ou parcial, de descrição geométrica das cenas 3d
correspondentes.
a motivação para a realização deste trabalho deveu-se ao facto de a computação
gráfica (cg) ser uma área em franco desenvolvimento, apelativa ao nível da interacção
visual. a cg é também um desafio enquanto aplicação de conceitos matemáticos e
como área didáctica para aplicação das novas tendências de aprendizagem utilizando a
multimédia. o tema central do trabalho resulta então da confluência desta vertente
matemática e da utilização de conhecimentos que envolvem educação multimédia. a
junção das áreas de cg, matemática e educação multimédia, permitiu alcançar uma base
de estudo sobre a qual foram definidos os objectivos deste trabalho no que diz respeito à
divulgação da técnica de light fields. assim sendo, na próxima subsecção, são
esclarecidos o objectivo geral e os objectivos mais específicos deste trabalho.
1.2 objectivos
o objectivo deste trabalho consiste em analisar a importância que uma aplicação
didáctica de light fields pode apresentar na compreensão desta técnica de image based
rendering (ibr), por utilizadores com bons conhecimentos em informática mas com
conhecimentos distintos na área da computação gráfica.
capítulo 1: introdução 3
de modo a atingir o objectivo geral do trabalho, diversos objectivos mais específicos
foram traçados, incluindo:
efectuar um estudo teórico sobre a radiância e sobre técnicas de image based
rendering, de modo a atingir as origens da técnica de light fields no contexto de
ibr;
estudar a técnica dos light fields com ênfase para a sua fundamentação teórica,
mas, também, para a sua aplicação prática e incluindo outros trabalhos da área
tais como os extended light fields;
disponibilizar uma aplicação em ambiente windows que permita a visualização
interactiva de light fields;
construir um sítio web sobre light fields que, associado à aplicação gráfica
windows, permita aos utilizadores obter uma rápida compreensão do,
complicado, conceito de light field;
realizar um estudo estatístico, baseado em resultados experimentais obtidos
através de questionários, que comprove a utilidade da abordagem proposta.
a utilização de uma aplicação para a construção de light fields com diferentes
parâmetros permite manipular e transformar as cenas tridimensionais com diferentes
resultados finais. ao objectivo inicial acrescentou-se a finalidade de percepção e
compreensão de como os utilizadores analisam a complexidade dos conceitos. para se
poder atingir este objectivo foi importante dar a conhecer a técnica para de seguida
obter a resposta de diversos utilizadores com bons conhecimentos em informática e
distintos conhecimentos na área da cg e da utilização de software de modelação gráfica
e visualização gráfica.
1.3 estrutura da dissertação
esta dissertação encontra-se estruturada em sete capítulos dos quais, o primeiro é
composto por esta introdução ao trabalho.
no segundo capítulo é apresentada a descrição do mundo real e como ele é visto do
ponto de vista físico e matemático, de modo a ser possível aplicar pressupostos de
simplificação para encontrar uma equação que permita compilar dados que traduzam as
cenas reais ou virtuais. após mostrar a equação de radiância são dadas a conhecer as
soluções apresentadas pela comunidade científica para esta equação. relativamente à
visibilidade e iluminação são também apontadas descrições, enquanto factores de
estudo, para aumentar a qualidade da cena.
capítulo 1: introdução 4
no capítulo três encontram-se as representações para o processo de síntese realista de
imagem em computador, sendo de especial realce os pressupostos de restrição do
espaço de vista. por fim, são apresentados subcapítulos que descrevem a importância da
amostragem e compressão, como processos fundamentais de estudo, para obter os
melhores objectivos para a representação do mundo real ou virtual, bem como permitir
que seja reduzido o espaço necessário em suporte informático.
no capítulo quatro, considerado fundamental para o entendimento da técnica de light
fields, é dada a definição e representação do conceito de light field, sendo que são
apresentados complementos teóricos sobre a geometria e representações do mesmo. no
fim do capítulo são apresentados os desenvolvimentos mais recentes e que estão a ser
utilizados, bem como as linhas de investigação futuras.
no quinto capítulo encontra-se a descrição do projecto e a implementação da aplicação
didáctica de light fields construída em ambiente windows. inicialmente é descrita a
metodologia genérica seguida para o desenvolvimento da aplicação. em seguida são
descritas as plataformas de desenvolvimento seleccionadas, o sistema desenvolvido, os
resultados obtidos e a manipulação das interfaces gráficas das aplicações desenvolvidas.
no capítulo seis está descrita a investigação estatística efectuada a partir da realização
de um questionário a utilizadores da aplicação didáctica desenvolvida. são
apresentados, inicialmente, os conceitos básicos sobre o modo de elaboração e
condução desta investigação a partir de questionários, sendo apresentadas em seguida as
inferências que podem ser concluídas através da utilização dos dados obtidos.
o último capítulo contém as conclusões gerais do trabalho, analisa os seus principais
resultados, e apresenta algumas perspectivas de desenvolvimentos futuros.
capítulo 2
2. equação de radiância
em termos computacionais, uma cena tridimensional é vulgarmente uma estrutura de
dados que representa um conjunto de objectos, em que cada objecto poderá ser uma
malha poligonal (ou um conjunto de superfícies curvas, em algumas situações) e cada
polígono será composto por uma sequência de pontos num plano. contudo, o “mundo
real” é algo que gera, reflecte e transporta energia. assim, o estudo que se tem vindo a
desenvolver para entender o comportamento da luz, como esta interage com as
superfícies e se propaga, bem como as características de percepção, têm sido objectivos
da computação gráfica, nomeadamente na área de síntese de imagem.
a criação de imagens através da avaliação de um modelo de propagação de luz é
vulgarmente conhecida por síntese de imagem, onde o fim a ser atingido é, usualmente,
fotorealismo. um dos problemas consiste em simular a iluminação das cenas de modo
que o processo de computação não seja moroso e que as imagens 2d projectadas sejam
próximas da realidade. de facto, pretende-se que o processo seja rápido e, para além
disso, em tempo real especialmente em situações de walkthrough em ambientes virtuais.
as imagens tiradas das cenas devem ser produzidas tão rapidamente como é o olhar
sobre o ambiente, com o objectivo de o observador experimentar a sensação visual
como se estivesse na cena real correspondente. idealmente, a simulação da iluminação
deverá ser tão precisa, e a velocidade da computação tão elevada, que não seja possível
distinguir o real do virtual. o problema ainda toma maiores proporções quando os
objectos da cena se movem e em situações em que a luz e o efeito que esta produz nos
mesmos objectos é alterada.
neste capítulo é efectuada uma abordagem à complexidade da luz, de como esta é
descrita de um ponto de vista matemático e físico, como é caracterizada a reflexão da
luz de uma superfície e como são formuladas as condições do equilíbrio do fluxo de luz
num ambiente. o estudo apresentado é baseado essencialmente nos trabalhos de cohen
[cohen et al., 1993] e slater [slater, 2000].
capítulo 2: equação de radiância 6
2.1 luz
a complexidade do problema da representação da luz advém do difícil processo da sua
interacção com os objectos.
a luz visível é uma radiação electromagnética com comprimentos de onda no intervalo
de 400nm e 700nm. na figura 1 pode ser visualizado o espectro electromagnético da
radiação.
figura 1: espectro electromagnético da radiação.
a luz tem propriedades compatíveis com fenómenos ondulatórios e de partículas, ou
seja, se é adoptado um modelo de onda de luz, e as experiências feitas tomam por base
esse modelo, então, as conclusões tiradas são também compatíveis com a teoria de
onda, sendo por outro lado, também válido para a teoria de partícula.
as partículas são chamadas de fotões, pacotes de energia que viajam em linha recta no
vácuo com velocidade c1
. os fotões também podem ser vistos como ondas. cada fotão
carrega energia e que é proporcional à frequência de onda correspondente:
e = h f (eq 1)
onde h é a constante de planck2
e f a frequência da onda electromagnética, sendo esta
inversamente proporcional ao comprimento de onda λ. de facto:
λ f = c (eq 2)
1
símbolo usual para a velocidade da luz, aproximadamente 300 000 km por segundo.
2
constante de planck: h = 6,626 2*10-34
js, fundamental em física, usada para descrever
quantitativamente o que se observa no espectro de radiação electromagnética.
violeta azul verde laranja vermelho infravermelhoultravioleta
700 nm400 nm luz visível
rádiomicroinfravermelhoultravioletaraios-xraios gama
10-6
10-4
10-2
10-1
1 101
102
104
106
108
1010
1012
capítulo 2: equação de radiância 7
os fotões têm outra propriedade particular: não interferem uns com os outros. assim,
dois raios de luz que se cruzem não interagem um com o outro. por exemplo, fotões ao
longo de caminhos, que chegam ao observador, não são afectados por outros que se
cruzam à frente do seu ponto de vista.
o problema de como a luz interage com as superfícies no espaço é um exemplo de um
problema de transporte. em geral está associado com a distribuição do movimento de
partículas num espaço.
denota-se por φ a energia radiante ou fluxo num volume v. o fluxo é a razão da
energia que flui através de uma superfície por unidade de tempo (que é medida em
watts). a energia é proporcional ao fluxo de partículas, uma vez que cada fotão
transporta energia. assim, o fluxo pode ser visto como o fluxo de fotões por unidade de
tempo.
de facto, a energia é variável com o comprimento de onda, de tal modo que, para
especificar energia radiante num volume deve usar-se a notação φλ , isto é, a energia
radiante de comprimento de onda λ. a partir de agora, no curso deste documento e em
termos de notação o λ deixa de ser usado e só φ passa a relacionar-se com um
comprimento de onda específico.
considerando o fluxo total de um volume, este deve estar em equilíbrio dinâmico, ou
seja, apesar do curso das partículas poder flutuar através do volume, a distribuição
abrangente mantém-se constante (por exemplo, partes da cena não começam a ficar
mais claras ou escuras de repente, mantendo outras o mesmo aspecto). para um
observador, é fácil verificar que, imediatamente após um emissor de luz ser ligado numa
cena, a energia da luz é distribuída instantaneamente através da mesma, e a iluminação
mantém-se constante. este processo não é instantâneo mas aparenta ser, devido à grande
velocidade da luz. em segundo lugar, a lei da conservação da energia aplica-se, pelo
que, a energia total introduzida num volume deverá ser igual à energia total que é
expelida e absorvida pela matéria no volume.
a iluminação pode ser introduzida num volume de duas maneiras: pode viajar de fora
para dentro (in-scattering) ou emitida de dentro do próprio volume (emission). a luz
pode sair do volume através de streaming (através dele sem interacção com qualquer
matéria) ou interagindo com a matéria no volume e depois ser reflectida (out-scattering)
ou poderá ainda ser absorvido pela matéria (absorption) dos objectos ou meios
participantes interiores ao volume [cohen et al., 1993]
assim temos a seguinte equação que formaliza as transposições da energia:
emission + in-scattering = streaming + out-scattering + absorption (eq 3)
capítulo 2: equação de radiância 8
seja φ(p, ω) o fluxo no ponto p na direcção ω , onde p ∈ v o volume, e ω ∈ г o
conjunto de direcções (onde ω é da forma (θ, φ)). cada um dos eventos na equação 3 é
expressa em termos probabilísticos. por exemplo, a absorção (absorption) a(p, ω) é
expressa como a probabilidade, por unidade de tempo de uma partícula no ponto p, ser
absorvida, viajando na direcção ω, uma vez que o total absorvido neste ponto e direcção
é a(p, ω) φ(p, ω). se for calculado o integral através do volume e direcções, a absorção
total no volume é:
∫∫γ
φ=φ
v
a dpdppa ωωω ),(),( (eq 4)
de forma semelhante, seja k(p, ω, ω’) a probabilidade de um fotão que viaja através da
direcção ω até ao ponto p ser reflectido na direcção ω’. assim sendo, o total de luz
reflectida (out-scattering) é:
∫∫∫γ ω
φ=φ
v
o dpddppk ωωωωω '),()',,( (eq 5)
( é o conjunto de todas as direcções na unidade de esfera).
existe uma expressão semelhante para in-scattering, φi , mas com os papéis de ω e ω’
invertidos.
o streaming é o fluxo total por toda a superfície, s, de v, em todas as direcções e pode
ser determinado pelo seguinte integral.
∫∫γ
φ=φ
s
s dpdp ωω),( (eq 6)
por fim, a emissão (emission) é especificada como ε(p, ω), o fluxo emitido (energia de
fotão, por unidade de tempo) no ponto p com direcção ω . assim, a emissão total num
volume é:
∫∫γ
=φ
v
e dpdp ωωε ),( (eq 7)
face às definições anteriores, a equação 3 pode ser escrita como:
φe + φi = φs + φo + φa (eq 8)
de acordo com esta análise, se for conhecido o valor em qualquer ponto p e direcção ω,
φ(p, ω), tem-se uma solução completa para o problema de iluminação em computação
gráfica. dá a energia de luz que flui em qualquer direcção (г) e em qualquer ponto
através de um volume de espaço (v). por exemplo, supondo a existência de um olho
virtual ou câmara na cena com o objectivo de criar uma imagem, será então necessário
encontrar todos os raios de luz que entram através da lente (isto é, um conjunto ω є ) e
que chegam à retina ou ao filme fotográfico. estas lentes deveriam corresponder a um
capítulo 2: equação de radiância 9
conjunto de pontos p e cada raio que atinge a superfície da lente carrega energia φ(p, ω)
que determina a resposta do olho ou da câmara. uma imagem será formada na retina
virtual ou no plano do “filme” que, visto por um indivíduo, gera a sensação associada à
vista da cena virtual.
para encontrar φ(p, ω), podia-se tentar resolver a equação 8, mas seria uma tarefa
complicada. por esse motivo, tentam-se encontrar aproximações para a solução, dotadas
do menor erro possível. o tipo de soluções varia consoante os requisitos iniciais: uma
solução que transmite a sensação de real-time é totalmente diferente daquela que produz
realismo de iluminação, sendo natural que se pretende um compromisso entre estes dois
extremos.
2.2 pressupostos de simplificação
de modo a obter aproximações da solução para a equação 8 alguns pressupostos são
admitidos, nomeadamente a independência do comprimento de onda, o tempo
invariante, o transporte de luz no espaço vazio e o facto de os objectos serem
isotrópicos.
2.2.1 independência do comprimento de onda
é usual assumir que não há interacções entre comprimentos de onda. por isso, a
equação 8 pode ser resolvida através de uma amostra de diferentes comprimentos de
onda, sendo estas soluções, posteriormente, combinadas em conjunto, dando uma
estimativa da distribuição do comprimento de onda de um ponto ao longo de um raio, o
que não considera o fenómeno de fluorescência (fluorescence) [foley et al., 1990]. este
é o processo no qual o material absorve a luz num determinado comprimento de onda e
reflecte num comprimento de onda diferente num período curto de tempo.
2.2.2 tempo invariante
é assumido que qualquer solução para a equação de distribuição de energia continua
válida com o tempo, a não ser que a geometria se altere na cena (por exemplo, um
objecto que mude de posição). não se considera assim a fosforescência
(phosphorescence) [foley et al. 1990] que ocorre quando a energia absorvida num
determinado momento é emitida mais tarde com (relativo) largo tempo de atraso.
capítulo 2: equação de radiância 10
2.2.3 transporte de luz em espaço livre
uma aproximação também vulgar é considerar que o meio pelo o qual a luz viaja é o
espaço livre, ou vácuo, em vez de um meio participante. assim sendo, o conjunto de
elementos da equação simplifica-se: absorção e out-scattering apenas ocorrem na
fronteira das superfícies; não há emissão excepto dos objectos; não há scattering ou
absorption, excepto na superfície dos objectos. isto significa que um raio de luz que não
seja obstruído (isto é, um raio entre dois objectos), não vê nenhuma da sua energia
absorvida, ou dispersa (scattered) ao longo do raio e, portanto, não há partículas de
matéria ao longo do raio que produzam energia adicional de luz. este pressuposto é
razoável para cenas que representam interiores de edifícios, apesar de, mesmo nestes
casos, o efeito do pó poder não ser considerado. é um pressuposto menos razoável para
cenas de exterior, onde a chuva, o nevoeiro ou outro tipo de condicionalismos causados
pela atmosfera produzem diferentes efeitos na luz.
2.2.4 objectos são isotrópicos
quando os fotões atingem uma superfície, a sua energia pode ser parcialmente
absorvida ou parcialmente reflectida. num material isotrópico, ao considerar-se uma
direcção incidente da luz e uma direcção de reflexão, a relação entre as duas energias é
a mesma em toda a superfície do objecto. este pressuposto simplifica o tipo de
expressão envolvida no termo k(p, ω, ω’), uma vez que k é independente do p na
superfície desse objecto. um material anisotrópico não possui esta propriedade que
caracteriza as substâncias de possuirem as mesmas propriedades físicas
independentemente da direcção considerada.
2.3 radiância
anteriormente foi utilizado o termo fluxo, porque é mais fácil para a percepção do
conceito: partículas que atravessam um volume (o número e a razão do fluxo destas
partículas) e os efeitos das suas colisões com a matéria no volume. contudo, a
quantidade real de interesse em computação gráfica não é propriamente o fluxo, mas
uma quantidade derivada deste, chamada de radiância. radiância (l) é o fluxo que sai
de uma superfície, por unidade de área projectada da superfície pela unidade de direcção
de ângulo sólido [cohen et al., 1993].
seja da a área da superfície pela qual a energia sai em direcção θ em relação à normal a
da, através de um diferencial ângulo sólido dω de acordo com a figura 2:
capítulo 2: equação de radiância 11
figura 2: radiância como o fluxo por unidade de área projectada por unidade de
ângulo sólido.
assim sendo, se a radiância que sai da área diferencial da é l, então:
ωθdldad cos2
=φ (eq 9)
na expressão anterior, d2
φ relaciona-se com um raio de luz na direcção θ. outro modo
de referenciar a radiância é l(p, ω), ou seja, é a função que é integrada ao longo do
ângulo sólido e área projectada de modo a obter o poder radiante (fluxo) daquela área.
na figura 3 são mostradas duas superfícies elementares, da e db. suponha-se r a
distância entre elas, e l a radiância de da até db. considere-se ainda φ(da,db) o poder
radiante transferido que pode então ser calculado da seguinte forma:
φ(da,db) = ldacos θad ωa (eq 10)
figura 3: fluxo entre duas superfícies elementares.
todavia, utilizando a equação do ângulo sólido diferencial [cohen et al., 1993] vem:
da
db
θa
θb
na
nb
da
n
dω
θ
capítulo 2: equação de radiância 12
2
cos
r
db
d b
a
θ
ω = (eq 11)
de onde segue que:
2
coscos
),(
r
dblda
dbda ba θθ
=φ (eq 12)
utilizando novamente a equação do ângulo sólido diferencial e simplificando-a, obtém-
se:
),(
cos
cos
cos),( 2
dadb
dldb
r
da
ldbdbda
bb
a
b
φ=
=






=φ
ωθ
θ
θ
(eq 13)
esta equação mostra que a direcção do fluxo pode ser invertida, ou seja, o fenómeno de
propagação da luz é reversível, seguindo o princípio geral de que as equações que
envolvem energia de luz são invariantes quando as direcções são revertidas.
a equação 12 mostra que o fluxo diminui com o inverso do quadrado da distância. por
isso, quando as duas áreas são afastadas, o fluxo também diminui. contudo, não sucede
o mesmo com a radiância: esta mantém-se constante ao longo de um raio, ou seja, é
independente da distância da fonte.
esta constatação leva a um princípio muito explorado em computação gráfica: muitas
vezes, os fotões que atravessam um volume de espaço são esquecidos e, em vez disso e
esquecendo a física por detrás destes conceitos, apenas se pensa nos raios que carregam
energia de luz representada por radiância. em vários modelos, não se consideram os
fotões e a energia que carregam, mas os raios e as radiâncias associadas.
há mais três grandezas relacionadas com a energia luminosa que são importantes em
computação gráfica. a primeira é conhecida como intensidade radiante: é o poder
radiante (ou fluxo) por unidade de ângulo sólido (em estereoradianos). se i é a
intensidade radiante, então o poder radiante associado é dado por:
dφ = i dω (eq 14)
comparando com a equação 10:
i = l da cosθ (eq 15)
onde l é a radiância correspondente.
capítulo 2: equação de radiância 13
ωr
ωi
n
θr θi
p
a segunda grandeza é denominada radiosidade: é o fluxo por unidade de área que radia
da superfície, denotada por b. se b é a radiosidade associada à energia que sai da área
da, então o fluxo pode ser recuperado através de:
dφ = b da (eq 16)
irradiância é o fluxo por unidade de área que chega à superfície. é usualmente denotada
por e e, se a irradiância que chega a da é e, então o fluxo é:
dφ = e da (eq 17)
supondo que l(p, ω) é a radiância que chega ao ponto p ao longo da direcção ω, segue
então da equação 9 que:
ωθωω dpl
da
d
pe cos),(),( =
φ
= (eq 18)
2.4 reflexão
até aqui abordou-se a distribuição da energia da luz de uma cena e foram efectuadas
breves referências sobre como a luz é absorvida e reflectida. em seguida é apresentada
uma análise mais cuidada sobre o processo de reflexão.
suponha-se que um raio de energia de luz atinge uma superfície num ponto p, com
direcção incidente ωi. o volume sobre o qual essa energia pode ser reflectida é o
hemisfério cuja base é o plano tangente no ponto p. realmente, este hemisfério contém
todo o conjunto de direcções visíveis do ponto p que não são obstruídas pela superfície
de que p faz parte.
figura 4: direcção da reflexão caso a superfície seja especular.
mas qual é a quantidade de energia que é reflectida numa qualquer direcção ωr? para
responder a esta questão é introduzido o termo f(p, ωi, ωr) chamado bidirectional
reflectance distribution function (brdf) que relaciona a radiância no ponto p, na
capítulo 2: equação de radiância 14
direcção ωr, com a irradiância e incidente no ponto p segundo a direcção incidente ωi.
assim,
l(p, ωr) = f(p, ωi, ωr)e(p, ωi) (eq 19)
especificações correctas de f(p, ωi, ωr) para superfícies do mundo real são tarefas
difíceis, especialmente se a superfície é anisotrópica. em computação gráfica praticam-
se, por vezes, abstracções longe do complexo mundo real e utilizam-se principalmente
duas idealizações das propriedades dos materiais, chamadas de reflectores difusos e
reflectores especulares e a mistura destes dois. um reflector especular puro corresponde
a uma superfície tipo espelho, que reflecte o raio incidente completamente num só raio e
com o ângulo de reflexão igual ao ângulo de incidência (ângulos medidos relativamente
à normal da superfície no ponto p). além disso, os vectores que correspondem a ωi e a
ωr estão sobre o mesmo plano que a normal como se pode observar na figura 4.
por outro lado, um reflector difuso é uma superfície “rugosa”, que divide a energia do
raio incidente em todas direcções de igual quantidade, ao longo de um hemisfério acima
de p. na figura 5 é demonstrada a reflexão difusa numa superfície.
figura 5: reflexão difusa: a luz radia num hemisfério à volta de um ponto da
superfície.
brdf’s mais complexas podem, no entanto, ser construídas. por exemplo, em cáusticas
geradas por um objecto de vidro (reflexões do vidro), um raio incidente pode ver a sua
energia dispersa num cone ao longo do raio especular reflectido ωr. um brdf é
tipicamente construído como uma mistura das duas componentes: difusa e especular.
tacitamente as superfícies são consideradas opacas. contudo, também existem
superfícies transparentes que devem ser consideradas. a abordagem é semelhante,
excepto que os raios de luz devem passar por diferentes meios (por exemplo do ar para
dentro de um bloco de gelo), sendo que a direcção depende da densidade do material.
capítulo 2: equação de radiância 15
2.5 equação de radiância
o problema de iluminação em computação gráfica seria resolvido se fosse possível
encontrar φ(p, ω) para todos os pontos e direcções, o que seria uma solução para a
equação 8.
de modo a simplificar a função e torná-la resolúvel, é introduzido um certo número de
pressupostos restritivos e o de maior interesse é a utilização da radiância em vez do
poder radiante, isto é, l(p, ω) em vez de φ(p, ω).
com todos os pressupostos de simplificação e usando os termos até aqui definidos, é
possível deduzir uma nova equação a partir da equação 8 que será de mais simples
compreensão, sendo expressa em termos de radiância em vez de fluxo. é chamada de
equação de radiância ou equação de rendering e fornece uma equação para a
radiância no ponto p numa superfície ao longo do raio dado pela direcção ω.
esta equação expressa o facto que a radiância deverá ser a soma de duas quantidades. a
primeira é a quantidade de radiância emitida directamente neste ponto (por exemplo, o
ponto pode estar numa superfície que é uma fonte de luz). a segunda corresponde a
uma parcela de irradiância que é reflectida nesse ponto. a quantidade reflectida pode ser
calculada como a soma de todos os raios que chegam a p (a irradiância total)
multiplicada por brdf para esta superfície. assim:
radiância = radiância emitida + total de radiância reflectida (eq 20)
para qualquer direcção ωi a radiância reflectida, na direcção ω, é a irradiância
multiplicada pela função brdf. usando as equações 18 e 19 vem:
l(p, ωr) = f(p, ωi, ωr) l(p, ωi) cosθi d ωi (eq 21)
se for calculado o integral ao longo do hemisfério de todas as direcções que chegam a p
é obtido o total de radiância reflectida (trr):
∫ω
= iiii dplpf ωθωωω cos),(),,(trr (eq 22)
assim, das equações 20 e 22 de radiância tem-se que:
φθθθωωωω
ωθωωωωω
π
π
ddplpfpl
dplpfplpl
iiiie
iiiie
sincos),(),,(),(
cos),(),,(),(),(
2
0
2
0
∫∫
∫
+=
+=
ω
(eq 23)
onde le(p, ω) é a radiância emitida.
capítulo 2: equação de radiância 16
suponha-se agora que p não está sobre uma superfície; então, uma vez que a radiância
não muda ao longo de um raio em espaço livre, pode encontrar-se o ponto p fazendo o
caminho inverso ao longo da direcção ω partindo dele até encontrar a superfície em p’.
então l(p, ω) = l(p’, ω). a figura 6 mostra uma representação esquemática da equação
de radiância.
figura 6: ilustração da equação de radiância.
considere-se qualquer raio que chega a p. de acordo com a equação 23, é necessário
calcular a radiância ao longo deste raio. então é percorrido em sentido contrário da
direcção ωi até encontrar outra superfície no ponto p’ e descobrir a radiância l(p’, ωi ).
mas de modo a encontrar isto é necessário usar novamente a equação de radiância, ou
seja, significa que está a ser aplicada a recursividade para determinar a radiância geral.
em termos usuais, a equação da radiância transmite o facto de que a iluminação é
globalmente determinada. a luz que se vê reflectida depende da luz, do material e da
superfície em termos da sua brdf.
2.6 soluções da equação de radiância
nas secções anteriores foi apresentada a dedução da equação de radiância e, tendo em
conta que nas aplicações de computação gráfica, o principal interesse é que esta
equação incorpore implicitamente todos os pontos de vista 2d, ou seja, imagens, que
representam a cena, o problema será então como extrair a informação necessária para a
construção destas imagens. o processo de extracção da equação de radiância para
imagens projectadas 2d é chamado de síntese de imagem ou rendering.
há duas grandes abordagens para realizar este processo: as soluções view-independent e
as view-dependent.
p
p’
l(p,ω)
e(p,ωi)
ωi
capítulo 2: equação de radiância 17
view-dependent significa que a equação de radiância é resolvida simplesmente para um
conjunto de raios considerados necessários para a formação da imagem (conjunto de
raios que entram no olho ou na lente da câmara). esta solução é chamada view-
dependent porque, se a situação de visão se altera (por exemplo, se o olho muda de
direcção), então todo processo de computação da radiância ao longo dos raios visíveis
terá de ser efectuado novamente. deste modo, a solução view-dependent especializa-se
em calcular l(p, ω) para o conjunto (p, ω), onde p está na superfície que representa a
lente e ω corresponde à direcção dos raios que passam pela lente.
uma solução view-independent concentra-se na pré-determinação de valores de l(p, ω)
ao longo de todas as superfícies da cena e por todas as direcções possíveis. assim, para
calcular uma determinada imagem, o conjunto de (p, ω) correspondente à superfície e
direcções que passam pela lente, ou seja, os valores correspondentes de l(p, ω) são
analisados em vez de serem calculados. esta abordagem é chamada view-independent
porque a solução para l(p, ω) é encontrada sem se restringir a uma particular direcção
de vista. possui a vantagem de que a produção de uma imagem de uma cena é uma
operação constante, independente do tempo, da complexidade da cena e da vista
particular. consome só o tempo de calcular as direcções e intersecções com a lente dos
raios e de procurar os valores de l correspondentes.
aproximações à solução da equação de radiância podem ser independentemente
classificadas em mais duas formas, dependendo se é uma solução global ou local. uma
solução local toma no máximo em consideração o efeito directo das fontes de luz nos
objectos, e não toma em conta a reflexão entre objectos, o que elimina a recursividade
da equação 23. nesta solução, o integral é substituído por um somatório sobre as
direcções incidentes correspondentes aos raios que provêm somente das fontes de luz,
cujos valores de radiância são conhecidos e que não têm de ser calculados
recursivamente. as múltiplas reflexões de luz são aproximadas por uma componente de
iluminação constante, designada por iluminação ambiente (garante iluminação de
objectos sem luz directa). é ainda usual considerar as fontes de luz como pontos
singulares de modo que, para cada ponto na superfície de um objecto, seja só um raio
que representa uma radiância que chega de uma fonte específica de luz.
de forma diversa, uma solução global considera a natureza recursiva da equação da
radiância, pelo menos através de algum tipo de inter-reflexão entre objectos. o método
denominado ray tracing [whitted, 1980] apenas considera a inter-reflexão entre
objectos com superfícies especulares. o método chamado de radiosity considera apenas
inter-reflexões entre objectos cuja superfície é difusa. outros métodos, usualmente
conhecidos por monte carlo, utilizam métodos estatísticos de um vasto conjunto de
direcções de raios e encontram uma solução global aproximada.
capítulo 2: equação de radiância 18
2.6.1 flat-shaded graphics
no método flat-shaded graphics a solução adoptada para a equação da radiância é
simples sendo calculado um só valor de l(p, ω) que é replicado em todos os pontos ao
longo da superfície.
em modos práticos significa que cada objecto tem uma radiância pré-indexada (pode
pensar-se em termos de cor). para qualquer ponto de vista os objectos são simplesmente
projectados em 2d e visualizados nas suas cores. é view-independent, porque a solução
é obtida sem ter em conta qualquer ponto de vista. é local, porque não há recursividade
na solução sem impactos de pares de fontes de luz primárias, excepto nos termos em
que cada objecto é tratado como uma fonte primária.
2.6.2 real-time graphics
neste processo a equação de radiância é simplificada, sendo o elemento recursivo
completamente removido. as fontes de luz são pontuais e só é incluída a iluminação
directa, o que significa que o integral é substituído por uma soma unicamente sobre
fontes de luz e, numa superfície, é simplesmente calculada a contribuição para cada luz
até p (sendo uma solução local). esta abordagem difere do ray tracing, que será descrito
a seguir, noutro sentido: no ray tracing os primeiros raios visíveis ao olho são
procurados pela cena. em real-time graphics todos os objectos são “projectados” na
superfície da lente – tornando-se assim em entidades 2d (raios não são utilizados
explicitamente). neste espaço projectado 2d, os valores da radiância pré calculados nos
vértices da superfície dos objectos são interpolados, para preencher as áreas sólidas
visíveis dos objectos. ray tracing envolve a procura ao longo do caminho dos raios para
os objectos que os raios intersectam, enquanto que real-time graphics o evita,
projectando directamente os objectos para a superfície da lente. assim, não há cálculos
computacionais intensivos de intersecção raio-objecto. é uma solução view-
independent, porque as projecções do objecto são válidas para um particular ponto de
vista e direcção.
2.6.3 ray tracing
o algoritmo de ray tracing, proposto por turner whitted [whitted, 1980], baseia-se
em colocar o observador por detrás de um ecrã transparente e lançar, a partir dos seus
olhos, raios que irão intersectar os objectos tridimensionais. em seguida pinta-se o
ponto do ecrã que foi atravessado pelo raio com a cor do objecto que foi atingido.
capítulo 2: equação de radiância 19
whitted desenvolveu mais o algoritmo assim descrito, continuando o processo. quando
o raio atinge a superfície da cena, pode gerar até três novos tipos de raios: de reflexão,
de transmissão e de detecção de sombra. um raio que foi reflectido continua na direcção
oposta ao ângulo de incidência numa superfície especular. é depois intersectado por
objectos na cena e o objecto mais próximo que é intersectado será visto na reflexão. os
raios que percorrem material transparente funcionam analogamente. saliente-se que o
raio pode estar a entrar ou sair do material. para evitar o cálculo de todos os raios na
cena, o raio de sombra é utilizado para testar se uma superfície é visível à fonte de luz.
assim sendo, se a superfície estiver virada para uma fonte de luz, um raio é lançado
desse ponto de intersecção para essa fonte de luz. se um objecto for encontrado antes da
fonte de luz, a superfície está em sombra e, por isso, será iluminada somente com a
intensidade de luz ambiente.
figura 7: imagem gerada utilizando ray tracing.
a equação de radiância é simplificada por apenas permitir fontes de luz pontuais. a
memória da equação da radiância é tomada em consideração por, recursivamente,
procurar o raio nas direcções reflectidas do ponto p até embater noutra superfície, e a
radiância ao longo do raio é novamente calculada recursivamente. a recursividade
continua até que toda a quantidade de radiância adicionada por um raio seja inferior a
um valor pré-indexado.
note-se que os caminhos de luz são procurados de trás para a frente, ou seja, do olho até
à cena. por este motivo, no algoritmo, e dado que é view-dependent as soluções são
encontradas para o conjunto específico de raios que entra no olho. é global porque a
solução inclui uma forma especial do termo recursivo do integral.
capítulo 2: equação de radiância 20
2.6.4 monte carlo path tracing
é semelhante ao ray tracing, todavia, consegue produzir uma solução estimada para a
equação da radiância que inclui reflexão especular e difusa. segue o mesmo princípio
geral em que os raios primários são procurados dentro da cena desde o ponto de vista do
observador. contudo, em vez de os raios recursivos seguirem caminhos específicos,
determinados pela direcção para reflexão especular, os raios são gerados seguindo uma
selecção aleatória. por isso, dada uma intersecção no ponto p de uma superfície, o
brdf é amostrado para escolher aleatoriamente um novo raio que lhe dê seguimento
por reflexão. isto será feito recursivamente até que sucessivas contribuições sejam
negligenciáveis. é um método view-dependent, porque começa pelos raios primários
visíveis ao observador e a solução só é válida para uma vista particular. é também um
método de iluminação global, uma vez que é uma solução estocástica para a equação de
radiância no total. na figura 8 é apresentada uma cena utilizando o método monte carlo
path tracing em que se pode ver o efeito produzido pela iluminação directa.
figura 8: imagem gerada utilizando monte carlo path tracing.
2.6.5 radiosity
no método radiosity a solução adoptada para resolver a equação de radiância é reduzir
a brdf a uma constante para todas as direcções de reflexão e eliminando todos os
aspectos relacionados com a direcção na equação. o método também transforma a
equação para ser re-expressa em termos de radiosidade em vez de radiância.
de modo a responder à eliminação de todas as considerações relacionadas com a
direcção, é assumido que todas as superfícies são reflectores difusos, ou seja, reflectem
capítulo 2: equação de radiância 21
a energia do raio incidente por todas as direcções com igual energia, tornando a
direcção irrelevante. como se pode observar na figura 9, o efeito visual da cena
caracteriza-se por a sala estar iluminada de forma brilhante, as sombras no chão
aparecerem esbatidas e efeitos subtis da luz estão presentes em toda a sala. é de
salientar que a cor vermelha do chão produz um efeito avermelhado nas paredes que são
pintadas de cinzento (efeito de mistura de cor ou color bleeding). o método pressupõe
um valor constante de energia radiante por unidade de área, pelo que as superfícies da
cena são divididas em pequenos elementos de superfície. a equação de radiância fica
reduzida a um sistema de equações lineares (uma equação para cada pequeno elemento
da superfície na cena) onde as incógnitas são as “radiosidades” associadas com os
elementos da superfície. a solução para esta equação resulta, por isso, na radiosidade
associada a cada pequeno elemento da superfície na cena ou, alternativamente, a pontos
na fronteira desses elementos da superfície.
figura 9: imagem gerada utilizando radiosity.
é uma solução view-independent, porque é calculada em termos da cena, em vez de ser
para qualquer conjunto particular de raios para um ponto de vista específico. é uma
solução global, uma vez que não tem em consideração as inter-reflexões entre as
superfícies difusas. uma vez feita a computação da radiosidade, é possível usar a
abordagem de real-time graphics para produzir vistas específicas.
2.6.6 monte carlo photon tracing
jensen [jensen, 1996] usou um método (monte carlo photon mapping) de dois passos
na procura de raios de fontes de luz, combinado com o método usual de procura de raios
para o ponto de vista. este método já tinha sido desenvolvido por shirley [shirley et al.,
capítulo 2: equação de radiância 22
1995] num método multi-stage que tinha a vantagem de produzir uma cena globalmente
iluminada para um passeio em tempo real, que utilizava técnicas de estimação estatística
de densidade. o método envolvia a produção de uma fina triangulação de todos os
objectos (poligonais) da cena [shirley et al., 1995]. a partir das fontes de luz são
procurados fotões com energia determinada pela distribuição de energia dos emissores e
as intersecções com os objectos são seguidas por monte carlo based tracing até que as
partículas sejam totalmente absorvidas. quando há um choque com uma superfície de
um objecto, a informação é guardada no polígono correspondente. no fim do processo
(que pode levar muitas horas para uma cena realista) todos os triângulos são arranjados
na ordem dos objectos. cada triângulo tem potencialmente uma distribuição associada
de choques de partículas que, em seguida, é utilizada para estimar a função de
densidade de radiância ao longo desse caminho. finalmente, triângulos adjacentes que
sejam suficientemente similares de acordo com o mesmo critério de tolerância são
“colados” juntos (este último passo é feito para reduzir o número total de triângulos
para a síntese de imagem ser mais rápida). a cena poderá ser então sintetizada em
tempo real utilizando o método de iluminação suavizada por interpolação bilinear de
gouraud [gouraud, 1971]. contudo, isto não é uma solução global para a iluminação e
superfícies especulares e as reflexões não são correctamente tratadas nesta fase de
síntese de imagem.
2.7 cálculo de visibilidade
há um aspecto implícito, mas computacionalmente muito intensivo, da equação de
radiância, que é o problema do cálculo de visibilidade. considerando um raio incidente
numa superfície no ponto p, coloca-se o problema de conhecer a sua origem, ou seja,
qual a superfície e o ponto concreto em que o raio tem início. ray tracing tem de
explicitamente procurar intersecções do raio, potencialmente, com todos os objectos da
cena (embora haja métodos para acelerar esta procura). este é um dos problemas de
cálculo de visibilidade: está-se apenas interessado nos raios incidentes das superfícies
que estão visíveis desde o ponto p (mesmo nestas situações podem surgir problemas
computacionais, nomeadamente com objectos transparentes cujos raios poderão não ter
um raio em linha recta de visibilidade até p, que ainda contribui para a energia de
iluminação).
o problema de visibilidade também ocorre em real-time graphics, embora não haja um
ray tracing explícito. os objectos são projectados na superfície da lente, mas nem todos
os objectos são visíveis ao observador, pelo que as relações de visibilidade entre
objectos, relativamente a uma vista particular, devem ser tomadas em consideração.
capítulo 2: equação de radiância 23
2.8 o problema de iluminação em image based
rendering
um paradigma diferente em síntese de imagem a discutir no capítulo 3, corresponde às
técnicas usualmente designadas por image based rendering (ibr) onde não há
praticamente um cálculo de iluminação. outros meios são, neste caso, utilizados para
capturar uma amostra de imagens (sejam fotografias digitais ou outro sistema de síntese
de imagem) com parâmetros de vista conhecidos. a essência desta abordagem é
sintetizar novas imagens, de acordo com parâmetros de vista que não estejam no
conjunto inicial desta amostragem. se as imagens originais forem capturadas por uma
técnica que preserva a iluminação global (por exemplo, fotografias de uma cena real,
desde que composta por reflectores difusos) então a técnica de ibr produzirá imagens
“globalmente iluminadas”. o ponto essencial é que os cálculos de iluminação não são,
por si só, parte do método de ibr, ou seja, não há nesta família de técnicas um cálculo
explícito de iluminação, sendo esta inerente às próprias imagens iniciais.
2.9 sumário do capítulo
o principal objectivo deste capítulo consistiu em mostrar como é possível encontrar
uma equação que traduza a iluminação presente no mundo real e o modo de produzir
soluções para que essa realidade seja expressa nas ferramentas computacionais. por
conseguinte, foram apresentados conceitos sobre a luz e iluminação para,
posteriormente, deduzir a equação de radiância que, contudo, não tem uma solução
analítica. deste modo, foi também apresentada a investigação na área que passou por
apresentar pressupostos de simplificação e algoritmos que maximizem a dualidade do
tempo e qualidade de realismo para obter soluções aproximadas da equação de
radiância. o estudo apresentado é importante para a completa compreensão dos
conceitos de image based rendering e light fields que serão apresentados em detalhe
nos próximos capítulos.
capítulo 3
3. image based rendering
síntese de imagem ou rendering consiste em gerar imagens realistas em computador.
baseia-se num modelo computacional 3d que integra a geometria da cena, as
características dos materiais dos objectos que se encontram na cena e as características
da iluminação. há dois grandes paradigmas na geração ou síntese de imagens:
geometry based rendering (gbr) significa síntese de imagens baseada em
geometria;
image based rendering (ibr) que explora e manipula imagens (fotográficas)
que já contêm quase toda a informação da cena real, de modo a criá-la. quase
todas as técnicas de representação de image based rendering derivam da
plenoptic function, que é uma função com 7 dimensões e difícil de manipular.
na figura 10 é apresentada uma descrição comparativa dos paradigmas de gbr e ibr.
o objectivo da técnica de ibr é reproduzir correctamente uma cena num ponto de vista
arbitrário, capturando um conjunto de imagens ou raios de luz no espaço, com limitada
ou mesmo sem informação sobre a geometria da cena. se esta técnica for comparada
com os modelos geométricos que dominam a síntese de imagem 3d tradicional, as
imagens são mais fáceis de obter, simples de trabalhar e mais realistas. como o
processamento de imagem é um tópico bastante estudado, o ibr tem atraído
comunidades de investigadores.
capítulo 3: image based rendering 25
figura 10: paradigmas gbr e ibr.
sendo o objectivo de ibr, capturar e sintetizar as cenas 3d deve começar por analisar-
se como é que o meio pode ser descrito. uma possibilidade é gravar todos os objectos
que fazem parte dele e as suas interacções, também conhecida por descrição da fonte. o
modelo tradicional de síntese de imagem adopta a seguinte descrição: as formas de
certos objectos são representadas por certos modelos geométricos; as propriedades da
superfície são descritas através de mapas de texturas e modelos de reflexão; a
iluminação e as sombras são o resultado da interacção entre fontes de luz e objectos. a
descrição da fonte é, normalmente, compacta e incisiva porque descreve como o mundo
é composto. no entanto, existe a desvantagem de nem sempre essa descrição estar
disponível. para se obter a descrição da fonte, daquilo que pode ser observado através
de câmaras ou dos nossos olhos, não tem sido uma tarefa fácil de realizar, sendo esse
um dos grandes objectivos a cumprir.
3.1 plenoptic function
um método alternativo de explicar o mundo real é baseado na sua descrição aparente. a
aparência do mundo pode ser analisada como um conjunto denso de raios de luz que
preenchem o espaço, que pode ser observado através da posição dos olhos ou câmaras.
este conjunto de luz pode ser representado através da plenoptic function, proposta por
adelson e bergen [adelson e bergen, 1991].
construção
do modelo
geometria
geometry based
rendering
mundo
conceptual
aquisição
de imagem
imagens
image based
rendering
mundo
real
rendering
desconectado
análise de
imagem
visão das cenas
capítulo 3: image based rendering 26
figura 11: sistema de coordenadas da localização espacial e direcção de vista.
como mostra a figura 11, a plenoptic function é uma função de dimensão 7 que
modela um ambiente dinâmico 3d, gravando os raios de luz em cada localização
espacial (vx,vy,vz) por qualquer direcção possível (θ,φ) para qualquer intervalo de
comprimento de onda (λ) e para qualquer instante (t), ou seja:
p(7)
= f(vx,vy,vz,θ, φ, λ, t) (eq 24)
como foi descrito por adelson e bergen [adelson e bergen, 1991]:
“o mundo é composto por objectos tridimensionais, mas esses objectos não comunicam
as suas propriedades directamente ao observador. em vez disso, os objectos preenchem
o espaço à volta deles com o padrão do conjunto de luz que constituem a plenoptic
function, e o observador recebe amostras desta função. a plenoptic function serve de
base de comunicação entre os objectos físicos e as imagens respectivas capturadas pela
retina. é o intermediário entre o mundo e o olho.”
quando se forma uma imagem numa câmara pinhole, a luz que passa pelo centro de
projecção da câmara é capturada na parede oposta da caixa de câmara. os raios de luz
também podem ser considerados como amostras da plenoptic function.
como o processo de image based rendering é baseado em imagens, adopta uma
descrição aparente. assim, é aqui definido ibr com base na plenoptic function como:
dada uma função contínua plenoptic function que descreve a cena, image based
rendering é um processo de duas fases – amostragem e síntese de imagem. na fase de
amostragem, as amostras são retiradas da plenoptic function para representação e
armazenamento. na fase de síntese de imagem, a função contínua plenoptic function é
reconstruída com as amostras capturadas.
um dos problemas em ibr é o número de dimensões da plenoptic function que dificulta
o processo de síntese. realmente, a grande quantidade de dados necessária torna quase
impossível amostrar toda a função numa só representação, pelo que a investigação feita
em ibr tem tido como finalidade encontrar os melhores pressupostos para reduzir o
capítulo 3: image based rendering 27
tamanho dos dados das amostras, mantendo uma qualidade razoável na fase de
rendering.
existem muitas representações na literatura sobre ibr [kang e shum, 2000]. estas
representações seguem basicamente duas grandes estratégias para reduzir a quantidade
de dados necessários. a primeira consiste em restringir o espaço de visualização do
observador. esta limitação reduz efectivamente a dimensão da plenoptic function, o que
facilita a amostragem e o rendering. a segunda estratégia consiste em introduzir fontes
de descrição da cena como a sua geometria.
uma vez determinada a representação de ibr, é possível reduzir ainda mais o tamanho
dos dados através de amostragem e compressão. a análise de amostragem pode fornecer
a informação do número mínimo de imagens (ou light rays) necessárias para sintetizar a
cena com qualidade satisfatória. por outro lado, a compressão pode ainda remover a
redundância dentro de uma imagem e entre imagens diferentes. devido à grande
redundância em muitas das representações em ibr um bom algoritmo de compressão
pode reduzir, substancialmente, o tamanho dos dados.
nas secções seguintes são apresentados alguns pressupostos que podem ser aplicados
para reduzir a quantidade de dados necessários para uma representação das cenas.
3.2 restrição do espaço de vista
o espaço de vista pode ser limitado e a quantidade de imagens necessárias para
reproduzir a cena pode ser amplamente reduzida. tome-se o exemplo extremo: se o
observador fica numa determinada posição e observa numa determinada direcção, uma
imagem ou uma sequência de vídeo capturada nessa posição e direcção é o suficiente
para representar a cena. outro exemplo são os branch movies [chen, 1995], onde
segmentos de filmes que correspondem a caminhos diferentes de navegação são
interligados através de pontos branch e o utilizador é obrigado a mover-se ao longo de
caminhos pré-definidos, podendo mudar o caminho nos pontos branch.
3.2.1 pressupostos para restringir o campo de
vista
há um conjunto de pressupostos que podem ser admitidos para restringir o espaço de
vista em ibr. alguns são preferíveis, porque não interferem no modo como o
observador experimenta a cena. outros têm o objectivo de reduzir o tamanho e tornam,
por isso, a cena mais limitada. a lista das possibilidades de pressupostos é:
1. comprimento de onda;
capítulo 3: image based rendering 28
2. radiância constante;
3. eliminação do tempo;
4. restrição aplicada ao movimento num plano;
5. restrição aplicada ao movimento num caminho;
6. observador numa posição fixa.
em seguida estes pressupostos são descritos e desenvolvidos com maior detalhe.
3.2.1.1 comprimento de onda
à medida que as imagens são tiradas para ibr, é possível simplificar a dimensão do
comprimento de onda em três canais (ou seja, rgb - red, green e blue). cada canal
representa a integração da plenoptic function sobre um determinado comprimento de
onda. esta simplificação pode ser cumprida ao longo da captura e rendering de ibr sem
grandes consequências na qualidade (quase todas as representações em ibr assumem
este pressuposto).
3.2.1.2 radiância constante
o ar é transparente e a radiância ao longo de um raio de luz no espaço vazio mantém-se
constante. é implícito neste pressuposto que não é necessário medir a radiância de um
raio de luz em diferentes posições ao longo do seu caminho, porque possuem o mesmo
resultado. para se verificar a utilidade deste pressuposto, limitemos o interesse aos raios
de luz que saem do convex hull de uma cena limitada. segundo este pressuposto, a
plenoptic function pode ser representada pelos seus valores ao longo de uma superfície
arbitrária envolvendo a cena, o que reduz mais uma dimensão à plenoptic function. a
radiância de qualquer raio de luz no espaço pode ser sempre obtida por tracing back até
à superfície seleccionada. por outras palavras, com este pressuposto é possível capturar
a cena a partir de um ponto e sintetizá-lo em sítios diferentes. este pressuposto é muito
utilizado [levoy e hanrahan, 1996] [gortler et al., 1996]. no entanto, uma câmara real
tem uma resolução finita. um pixel, numa imagem, é a média dos raios de luz que
atravessam a área correspondente na superfície da cena. se forem colocadas duas
câmaras numa linha e capturado o raio de luz ao longo dela é possível haver resultados
diferentes, uma vez que o tamanho observado da área da superfície da cena pode ser
diferente. esta sensibilização de resolução foi estudada por [buehler et al., 2001].
3.2.1.3 eliminação do tempo
se a cena é estática, a dimensão tempo pode ser eliminada. apesar de uma cena
dinâmica incluir mais informação do que uma cena estática, há preocupações práticas
capítulo 3: image based rendering 29
que limitam a popularidade da sua representação via ibr. uma preocupação é o
tamanho das amostras dos dados. se é capturada uma cena de vídeo, o tamanho tende a
ser muito maior do que se fosse capturada uma simples imagem estática. da mesma
forma é esperado que ibr dinâmico aumente na mesma ordem em relação ao ibr
estático. ibr exige muitas vezes uma grande quantidade de câmaras para capturar uma
cena. se o objectivo é capturar uma cena dinâmica, um conjunto de câmaras deverá
estar presente a capturar vídeo ao mesmo tempo. o conjunto mais conhecido e que tem
um considerável conjunto de câmaras é o de stanford light field vídeo câmara
[wilburn, 2002], que consiste num conjunto de 128 câmaras, como se pode observar na
figura 12.
figura 12: conjunto de 128 câmaras construído para o projecto inicial stanford
immersive television da universidade de stanford.
contudo, ainda não será ainda suficiente para produzir um rendering de imagens com
elevada qualidade. capturar imagens estáticas produz tantos problemas, porque existe a
possibilidade de usar o eixo do tempo para compensar a falta de câmaras. isto significa
que imagens capturadas em diferentes períodos de tempo e em diferentes posições
podem ser utilizadas para sintetizar novos pontos de vista.
3.2.1.4 restrição aplicada ao movimento num plano
se o observador, em vez de se movimentar no espaço 3d, ficar limitado a movimentar-
se numa superfície, isto é num plano base, pode ser reduzida uma dimensão à plenoptic
function, já que o local do observador se torna 2d. apesar de parecer que reduzir o
ponto do observador a um plano é desagradável, este pressuposto é aceitável por duas
razões: primeiro, o olho humano é menos sensível à paralaxe vertical e às mudanças de
iluminação porque os dois olhos estão espaçados na horizontal. em segundo, o olho está
capítulo 3: image based rendering 30
a um certo alto nível para caminhar nas aplicações. o exemplo das cenas usando
mosaicos concêntricos [shum e he, 1999] mostra a possibilidade de produzir grandes
efeitos 3d no movimento e na iluminação, tomando este pressuposto.
3.2.1.5 restrição aplicada ao movimento num caminho
o observador só se move ao longo de um caminho, ou seja, o observador pode mover-se
para a frente e para trás ao longo de um caminho, mas não poderá sair desse percurso.
com este pressuposto consegue-se reduzir duas dimensões à plenoptic function (branch
movies [chen, 1995] são um exemplo). este pressuposto é também razoável para
aplicações de visita virtual, onde o observador segue um caminho pré-definido para ver
uma cena maior.
3.2.1.6 observador numa posição fixa
o pressuposto mais restritivo é o observador estar numa posição fixa o que consegue
reduzir a dimensão da função plenoptic function a três variáveis. nenhum efeito 3d
pode ser percebido aqui; contudo, a representação de ibr resulta bastante compacta e,
apesar disso, apresenta muitas semelhanças com imagens e vídeos regulares. capturar
dados e obter esta representação é também simples. atendendo a estes princípios a
tecnologia de quicktime vrtm
[chen, 1995], baseando-se neste pressuposto, tornou-se
uma técnica de ibr bastante popular.
3.3 representações e o processo de rendering
tomando os pressupostos mencionados anteriormente, a função 7d plenoptic function
pode ser reduzida a funções de mais baixa dimensão. uma breve descrição das diversas
técnicas será apresentada de seguida.
3.3.1 surface plenoptic function
a função surface plenoptic function (spf) foi pela primeira vez introduzida por [zhang
e chen, 2003]. trata-se de uma simplificação da função 7d plenoptic function, pela
utilização do segundo pressuposto, descrito anteriormente. como já foi referido, a
radiância mantém-se constante ao longo de um raio de luz no espaço vazio. a plenoptic
function pode ser representada pelos seus valores em qualquer superfície que envolve a
cena. para a superfície regular da cena com dimensão 2, a spf é uma função de
dimensão 6: posição na superfície (2d), direcção do raio de luz (2d), tempo (1d) e
comprimento de onda (1d). apesar da dificuldade de aplicação de spf na captura de
cenas reais devido ao desconhecimento da geometria da cena, spf foi utilizada em
capítulo 3: image based rendering 31
[zhang e chen, 2003] para analisar o espectro de fourier para a representação de ibr.
a função surface light field [wood et al., 2000] pode ser considerada uma versão
reduzida da spf, que atribui uma cor (rgb) a cada raio que tem origem na superfície
de um objecto da cena.
3.3.2 plenoptic modeling e light field video
ao ignorar a dimensão do comprimento de onda e a do tempo, mcmillan e bishop
[mcmillan e bishop, 1997] introduziram a plenoptic modeling que é uma função de
dimensão 5:
p(5)
= f(vx,vy,vz,θ, φ) (eq 25)
no trabalho original apresentado por aqueles autores foi gravada uma cena estática
posicionando câmaras no espaço de visão 3d, cada uma em cima de um tripé capaz de
seguir a cena continuamente. em cada posição, uma imagem cilíndrica projectada foi
composta através das imagens capturadas durante o movimento (panning). isto forma
uma representação 5d de ibr: 3d para a posição da câmara e 2d para a imagem
cilíndrica. para sintetizar um novo ponto de vista da representação 5d, o cilindro mais
perto de imagens projectadas são levadas para a posição de vista baseada nas relações
epipolares e alguns testes de visibilidade.
a técnica light field video [wilburn, 2002] [yang et al., 2002] é uma outra
representação 5d baseada nos pressupostos 1 e 2, sendo uma extensão dos 4d light
fields. o light field video captura cenas dinâmicas usando um conjunto de câmaras.
devido à restrição na utilização de hardware, o número de câmaras no conjunto é
bastante limitado, 128 em [wilburn, 2002] e 64 em [yang et al., 2002]. por isso tornam-
se visíveis os efeitos de aliasing3
e ghosting4
dos vídeos sintetizados.
3.3.3 light fields e lumigraph
as representações de ibr 4d mais conhecidas são os light fields [levoy e hanrahan,
1996] e lumigraph [gortler, 1996]. ambas ignoram o comprimento de onda e o tempo
e assumem que a radiância não muda ao longo de uma linha no espaço livre. apesar da
parametrização do espaço de linhas orientadas ainda ser um problema, as soluções
3
aliasing um efeito do tipo serrilhado que implica que linhas diagonais não sejam perfeitas em virtude da
divisão discreta em pixels de um monitor.
4
ghosting é uma distorção da imagem que foi amostrada fazendo que com imagens prévias ainda sejam
visíveis em imagens posteriores.
capítulo 3: image based rendering 32
apresentadas para ultrapassar esta dificuldade acabaram por ser a mesma: os raios de luz
são gravados pelas suas intersecções com dois planos, um é indexado com coordenadas
(u,v) e o outro com as coordenadas (s,t).
figura 13: parametrização do light field.
na figura 13 é mostrado um exemplo onde os dois planos (chamados plano de câmara e
plano focal) são paralelos, sendo esta a forma de representação mais utilizada. um
exemplo de light ray é mostrado na figura e indexado com (uo,vo,so,to). os dois planos
são discretizados de tal modo que um número finito de light rays é gravado. se todos os
pontos discretizados forem ligados do plano focal aos pontos do plano de câmara, é
obtida uma imagem (conjunto 2d de raios de luz). portanto, a representação 4d é
também um conjunto 2d de imagens. para criar uma nova vista do objecto,
simplesmente é dividida a vista nos seus raios de luz, que são posteriormente calculados
por interpolação quadrilinear por existir raios de luz na vizinhança do conjunto de
imagem.
objecto
raio luz
u
v
t
s
plano de câmara (uv)
plano focal (st)
(uo,vo,so,to)
capítulo 3: image based rendering 33
figura 14: processo de discretização dos planos uv e st.
por exemplo, na figura 14 o raio (uo,vo,so,to) é interpolado através de raios de luz que
ligam os pontos discretos sólidos aos dois planos. a nova vista é então gerada por
semelhança conjunta dos raios divididos. esta síntese de imagem pode ser feita em
tempo real [sloan, 1997] [lensch, 1999] e é independente da complexidade da cena.
3.3.4 concentric mosaics
para além dos pressupostos referidos para os light fields, os concentric mosaics
restringem a câmara e o observador a mover-se num plano (pressuposto 4), o que reduz
a dimensão da plenoptic function a três. com os concentric mosaics a cena é capturada
através de uma câmara montada no fim de cada nível de célula, e capturam-se imagens
em intervalos regulares à medida que a célula gira, como é mostrado na figura 15.
figura 15: captura de concentric mosaic [shum e he, 1999].
u
v
s
t
(uo,vo,so,to)
capítulo 3: image based rendering 34
os raios de luz são indexados pela posição de câmara ou pela rotação de célula por um
ângulo α e pela localização do pixel (u,v):
p(3)
= f(α,u,v) (eq 26)
esta parametrização é equivalente a ter muitas câmaras slit (disposição em régua)
[shum e he, 1999] rodando com um centro comum e tirando imagens ao longo da
direcção da tangente. cada câmara slit captura um mosaic manifold, dentro do qual os
pixels podem ser indexados por (α,u), por isso o nome concentric mosaics. durante o
rendering, o observador poderá mover-se livremente dentro do círculo de rendering
com raio 





2
sin
fov
r , onde r é o raio do caminho da câmara e fov é o campo de
vista das câmaras. o rendering de concentric mosaics é baseado em slit. a nova vista é
dividida em slits verticais. por cada slit, os slits vizinhos nas imagens capturadas são
alocadas e usadas para interpolação. a vista sintetizada é parecida usando estes slits
interpolados.
há um problema associado aos concentric mosaics – a distorção vertical. infelizmente,
e apesar de ser densa a captura de imagens no caminho de câmara, não é fácil eliminar a
distorção vertical. no documento original de concentric mosaics [shum e he, 1999], foi
introduzida uma correcção de profundidade para reduzir a distorção, baseada em algum
conhecimento sobre a geometria da cena.
apesar da distorção vertical, concentric mosaics ainda é um método bastante aliciante
dada a sua simplicidade.
outra representação 3d em ibr é o vídeo panorâmico [chen, 1995]. pode ser usado
tanto para cenas dinâmicas (fixar o ponto de vista, pressupostos 1 e 6) como para cenas
fixas (pressupostos 1, 3, e 5). se for comparado com sequências de vídeo regular, o
campo de vista, o vídeo panorâmico é muitas vezes de 360º, o que possibilita o
observador fazer zoom e movimentos (panning) interactivamente. se a cena é estática, o
observador pode também rodar [chen, 1995]. capturar vídeo panorâmico é acessível.
se for utilizado um sistema de multi-câmara [foote e kimber, 2000] ou uma câmara
omnidireccional [nayar, 1997], ou uma câmara com lente olho de peixe, é fácil obter
uma sequência de vídeo panorâmico. fazer o rendering deste tipo de vídeo envolve
warping de imagens cilíndricas ou esféricas para imagens planares projectadas. devido
à facilidade de captura e rendering, de uma qualidade perceptível e pelo requisito de
armazenamento, multi-panoramas são adoptadas para diversos sistemas usados para
capturar cenas em grande escala como em [kawasaki et al., 2001].
capítulo 3: image based rendering 35
3.3.5 image mosaicing
image mosaicing compõe um simples mosaico com imagens múltiplas. o mosaico de
saída é uma função 2d plenoptic function. muitas vezes este mosaico é composto com
objectivos simples como aumentar o campo de vista da câmara, com aplicação em
fotografias aéreas e animação [wood, 1997]. as técnicas de image mosaicing,
dependendo da colecção de raios gravados no mosaico, podem ser classificadas em duas
categorias: single-center-of-projection mosaic ou multiple-center-of-projection mosaic.
na maior parte dos casos, os raios de luz gravados no mosaico partilham do mesmo
centro de projecção (cop - center of projection), que são chamados de panoramic
mosaic ou panorama.
figura 16: exemplo de um panorama utilizando image mosaicing.
os raios de luz estão indexados à sua direcção, ou seja:
p(2)
= f(θ,φ) (eq 27)
apesar de ser fácil obter um panorama através de sistemas intensivos de hardware
[nayar, 1997], o foco de estudo é como construir panoramas cilíndricos e esféricos
colando múltiplas imagens [mcmillian et al., 1995]. usualmente, as imagens de input
são capturadas do mesmo ponto de vista e estão relacionadas pela transformação
projectiva 2d. se o conjunto de transformações for conhecido à posteriori, as imagens
podem ser coladas facilmente. outras técnicas também foram desenvolvidas para obter
estas transformações sem pontos específicos de correspondência [szeliski, 1994]. um
assunto prático é que as imagens de input poderão não seguir uma partilha estrita com o
mesmo cop, o que causa efeitos de ghosting no mosaico resultante. estes efeitos
poderão ser eliminados através de algoritmos locais de alinhamento [szeliski e shum,
1997].
num cenário mais geral, as câmaras das imagens de input podem mover-se de uma
maneira livre e o mosaico resultante ter cop múltiplos. em contraste com o mosaico
panorâmico onde os raios de luz são indexados pelas suas direcções, os mosaicos cop
capítulo 3: image based rendering 36
múltiplos indexam muitas vezes os raios de luz por uma certa superfície ou manifold,
razão pela qual recebe o nome mosaico manifold. a direcção dos raios de luz é
perpendicular ou tangencial à superfície do manifold. nos concentric mosaics a
parametrização 3d é equivalente a ter muitas câmaras slit rodando à volta de um centro
comum e capturando imagens ao longo da direcção tangencial. cada câmara slit captura
um mosaico manifold, que pode ser indexado através de pontos numa superfície 2d
cilíndrica (α,u). todos os raios de luz capturados são tangenciais a essa superfície. em
[peleg, 1997], os mosaicos manifold são construídos através da colagem de imagens slit,
assumindo que o movimento da câmara é lento. efectivamente, a superfície que é usada
para a parametrização do raio de luz tem várias formas como planos, cilindros ou outras
superfícies. se o centro de slits das imagens capturadas são usadas para a colagem,
como foi sugerido em [peleg, 1997], os raios de luz serão aproximadamente
perpendiculares a estes manifolds. um particular e interessante mosaico é construído
quando a câmara faz o movimento para trás e para a frente. a projecção pipe foi usada
para a construção do mosaico numa superfície pipe [peleg 2000].
a síntese de uma imagem mosaico é bastante simples. para o mosaico panorâmico é
usual efectuar um warping de um cilindro ou de uma esfera mosaico projectado em
imagens planares projectadas, como é feito no vídeo panorâmico. este warping é muitas
vezes desconhecido num mosaico geral manifold. por isso as regiões do mosaico podem
ser usadas directamente na síntese de imagem, desde que o campo de vista da imagem
sintetizada seja suficientemente pequeno [wood, 1997]. note-se que em ambos os casos
o movimento do observador é muito restrito. em mosaico panorâmico o observador só
se pode mover ao longo de uma superfície/caminho fixado e através de uma direcção
também fixa. é possível alargar esta restrição se forem capturados mosaicos múltiplos.
o quicktime hopping [chen, 1995] e o manifold hopping [shum, 2002] são duas
extensões dos mosaicos panorâmicos e mosaicos manifold, respectivamente.
para além de aumentar o campo de vista da câmara, image mosaicing pode também ser
utilizado para aumentar a resolução de imagem, a saber super-resolution [borman e
stevenson, 1998].
3.4 amostragem
na secção anterior foram apresentados as várias representações de ibr e os seus
esquemas de síntese de imagem, o que permitiu responder à questão de como amostrar e
reconstruir a plenoptic function. contudo, a informação sobre a quantidade de amostras
necessárias para que a reconstrução da função seja realizada minimizando os efeitos de
aliasing, é também uma parte importante de estudo. assim sendo, são conhecidas várias
respostas a este problema algumas das quais são a seguir enumeradas.
capítulo 3: image based rendering 37
a amostragem de ibr é um problema difícil de resolver devido à elevada dimensão do
sinal. a razão de amostragem é normalmente determinada em função da geometria da
cena, da textura da superfície da cena, das propriedades da reflexão, do movimento dos
objectos; da representação e da resolução da câmara de captura, entre outros
condicionalismos. uma enorme quantidade de amostras era utilizada nos primeiros
trabalhos conhecidos, uma vez que não havia solução para este problema. para reduzir a
enorme quantidade de dados guardados devido à elevada amostragem, vários esquemas
de compressão foram apresentados de modo a cumprir essa função. no início do ano
2000, foram publicados diversos artigos pioneiros nesta área [chai, 2000] [chan, 2003]
[lin e shum., 2000].
como foi defendido em [chan, 2000], a amostragem é essencialmente um problema de
processamento multi-dimensional de sinal. seguindo o teorema clássico de amostragem,
primeiro deverá ser encontrada a transformada de fourier da plenoptic function e depois
amostrá-la de acordo com a largura de banda do espectro. no entanto, apesar de na
teoria ser possível encontrar a transformada de fourier da plenoptic function de
dimensão 7, na prática é necessário reduzir a dimensão de sinal.
baseado no pressuposto 1, a dimensão do comprimento de onda pode ser ignorado na
maioria das aplicações de ibr. o pressuposto 2 considera que a radiância de um raio de
luz ao longo do seu caminho se mantém constante no espaço vazio. na realidade, apesar
da resolução das câmaras reais ser finita, o pressuposto poderá não ser estritamente
válido [buehler, 2001], a amostragem ao longo do caminho do raio e a variação da
radiância poderá ser, muitas vezes, lenta. pelo pressuposto 3, a dimensão tempo poderá
ser ignorada. na prática, mesmo sendo capturada uma cena dinâmica, a amostragem no
eixo do tempo é muitas vezes determinada pela razão da frame da câmara e pela
propriedade da percepção temporal do sistema de visão [lin e shum, 2000]. devido a
estas razões a maior parte do trabalho de ibr para compressão apresentado na literatura
refere-se a light fields e concentric mosaics.
3.5 compressão
apesar de, através de uma amostragem criteriosa se conseguir diminuir o número de
imagens fonte em ibr, a quantidade de imagens necessárias ainda é elevada. para o
espaço necessário de armazenamento em ibr ficar ainda mais reduzido, a solução será
utilizar técnicas de compressão, justificando-se assim o recurso a técnicas de
compressão de dados.
a compressão em ibr é semelhante à utilizada em imagem e vídeo, porque ibr é
normalmente capturado como uma sequência de imagens. no entanto, a compressão em
capítulo 3: image based rendering 38
ibr tem também as suas particularidades. como foi mostrado em [shum, 2001],
imagens em ibr apresentam boas correlações ao longo das frames por causa do
movimento regular da câmara. por isso, é de esperar uma boa compressão em ibr.
a compressão de imagens recorre muitas vezes a métodos destrutivos. no âmbito de
ibr, isto traduz-se em distorções de informação às quais o sistema visual humano
reage, sendo este, também, um tema de análise. uma vez que durante a síntese de
imagem em ibr qualquer light ray capturado pode ser utilizado para interpolação, é
desejável que o bitstream comprimido esteja acessível de modo aleatório, de modo que
não seja necessário descomprimir todos os light rays em memória. esta propriedade
também é importante para o streaming online dos dados de ibr.
vector quantization (vq) é o primeiro recurso para a redução de tamanho de dados em
ibr [levoy e hanrahan, 1996] [shum e he, 1999]. assume-se um método universal e
fornece um rácio razoável de compressão, assim como uma rápida velocidade de
descompressão. o comprimento do código do índice de vq tem tamanho fixo e é
acessível de modo aleatório e tem aplicações potenciais em streaming online. por outro
lado, vq não faz uso completo de correlações dentro e entre as imagens capturadas.
os vários algoritmos podem também ser aplicados a imagens de ibr individuais sem
alterações. foram utilizados em [miller et al., 1998] os algoritmos de dtc-based jpeg
para a compressão de light fields [miller et al., 1998] e foi obtido uma taxa de
compressão mais elevada do que para vq. os standards baseados em wavelets
jpeg2000 [taubman e marcellin, 2001] melhoram ainda a performance e adicionam
características como a escalabilidade. uma vez que a codificação de comprimento de
variável (vlc-variable length coding) é empregue, a velocidade de acesso não é tão
rápida como vq. no entanto, ainda é suficiente para o rendering para tempo real. a
limitação é que a correlação inter frames não é utilizada, uma vez que o rácio é
relativamente baixo.
a maior parte dos métodos propostos [magnor et al., 2000b] [zhang e li, 2000] são
próximos à codificação de vídeo, com certas modificações para as características
específicas dos dados de ibr.
as técnicas de codificação de vídeo básico incluem, entre outras: compensação de
movimento (mc – movement compensation); a transformada discreta de cosseno
(dct- discrete cosine transform); quantificação e vlc (variable length coding). as
imagens são divididas em duas categorias: intra frames e inter frames. as intra frames
são normalmente distribuídas uniformemente e codificadas independentemente,
enquanto que inter frames são previstas através de intra frames vizinhas através de mc.
um método bastante utilizado e exemplo deste tipo de aplicação é o standard de
codificação de vídeo mpeg-2 [mitchell et al., 1996]. uma abordagem intuitiva para a
capítulo 3: image based rendering 39
compressão de ibr é aplicar estes métodos directamente para a sequência de imagens
de ibr. em [shum et al., 2000] foi proposta a compressão de concentric mosaics com
mpeg-2. para facilitar o acesso aleatório foram construídos apontadores para o início
das posições para cada grupo vertical de macro-blocos (mb) no bitstream. extensões
directas desta abordagem foram utilizadas para vídeo panorâmico [shum et. al 2001 b]
e para light fields dinâmicos simplificados [chan et al. 2003].
como o movimento das câmaras durante a captura em ibr é bastante regular torna-se
mais eficaz aplicar métodos mais avançados para a compressão de ibr. em [zhang e
li, 2000] foi proposto o reference block coder (rbc) que aplica um esquema mc em
duas fases. o panning horizontal entre imagens capturadas vizinhas foi extraído em
primeiro lugar como um vector de movimento de translação horizontal. refinamento
local mc foi depois utilizado para reduzir o resíduo de mc. outra aplicação do rbc foi
a utilização de cache durante o rendering o que garantiu o chamado just-in-time
rendering. nos light fields, as câmaras estão dispostas num plano 2d. por isso a
estrutura de mc deverá também ser 2d e as intra frames são distribuídos
uniformemente no plano 2d. dada uma qualquer inter frame, quatro intra frames estão
normalmente disponíveis e podem todas ser utilizadas para mc.
mais desenvolvimentos na compensação de movimento incluem sprite based coding e
model based coding. em [leung e chen, 2002] foi apresentado um método de
compressão sprite based para concentric mosaics. um sprite é gerado através da
colagem dos slits centrais de todas as imagens capturadas. de facto, o resultado é um
cilindro panorâmico rugoso. o sprite é intra coded e todas as imagens capturadas são
codificadas baseadas em previsões do sprite. este tipo de esquema tem boa
acessibilidade. quando a geometria da cena está disponível consegue-se ganhar na
previsão da imagem [magnor et al., 2000b]. uma estrutura de previsão hierárquica é
adoptada, onde as imagens intra codificadas e a geometria do modelo são utilizadas em
conjunto para prever as inter frames. em [magnor et al., 2000b] as imagens são
mapeadas sobre o modelo de geometria como mapas de textura dependente. estes
mapas de textura são depois codificados através de codecs 4d de wavelets.
a codificação scalable vídeo e a codificação arbitrária de forma de objecto são duas
componentes chave no standard de compressão de vídeo de mpeg-4. codificação
scalable vídeo inclui scalability espacial, temporal e snr fine granularity scalability
(fgs) e object-based scalability. ng propôs uma abordagem de scalability espacial
para a compressão dos concentric mosaics em [ng, 2001]. utilizando uma reconstrução
filter bank não linear, as imagens são decompostas em bandas de frequência diferentes e
codificadas separadamente com o standard mpeg-2. se se estiver com online
streaming, uma imagem de baixa resolução pode ser sintetizada enquanto que a base de
banda de bitstream de compressão chega e pode ser refinada mais tarde quando mais
capítulo 3: image based rendering 40
dados forem recebidos. escalabilidade temporal é aplicável a cenas dinâmicas para
representação de ibr tais como vídeo de light fields ou vídeo panorâmico ou poderá
ser considerado como escalabilidade ao longo de imagens diferentes. codificação de
objectos arbitrários de vídeo modelado pode melhorar o desempenho de compressão,
porque melhora a compensação de tempo, remove o fundo e evita a codificação da
descontinuidade à volta da fronteira do objecto, o que foi adoptado na compressão de
light fields [chang, 2003].
a codificação 3d de wavelet apresenta outra categoria de métodos para a codificação de
vídeo [taubman e zakhor, 1994] [ohm, 1994] [tham et al., 1998]. a codificação por
wavelet foi estendida à dimensão 4, para a compressão de light fields, tais como os
apresentados em [peter e straber, 1999] [girod et al., 2003] [magnor et al, 2000a]
[lalonde e fournier, 1999].
3.6 sumário do capítulo
neste capítulo foram descritas as mais conhecidas técnicas de ibr com ênfase nas
técnicas surface plenoptic function, light field e lumigraph, concentric mosaics e
image mosaicing. estas técnicas advêm originalmente da plenoptic function tendo sido
aplicadas algumas simplificações para reduzir o número de variáveis que a compõem. a
aplicação dos pressupostos de simplificação tornou possível o aparecimento destas
novas respostas e metodologias de ibr.
os processos de amostragem e compressão foram também brevemente referenciados,
uma vez que o estudo dentro destes domínios e, apesar de não ser um dos objectivos
deste trabalho, tomam contornos cada vez mais importantes na investigação científica
em ibr. muitos outros métodos de amostragem existem no contexto de ibr, no
entanto, a sua descrição detalhada ultrapassa o objectivo definido para este trabalho.
no próximo capítulo será analisada em mais detalhe a técnica de light fields,
envolvendo a sua definição, o tipo de geometria básica e as diferentes representações.
capítulo 4
4. light fields
no capítulo anterior foram descritas algumas técnicas de image based rendering que
tentam solucionar a equação de radiância. levoy e hanrahan [levoy e hanrahan, 1996]
e também gortler [gortler et al., 1996] providenciaram uma solução baseada em
imagens para a equação de radiância sob um certo número de restrições. conforme visto
na secção 2 a equação de radiância é uma expressão recursiva para a radiância l(p, ω),
onde p é um ponto qualquer de uma superfície e ω é o conjunto de todas as direcções.
qualquer conjunto p e ω específico formam um raio, uma vez que podemos pensar em
l(p, ω) como o conjunto de todos os raios com origem nos pontos das superfícies.
devido ao domínio de l, a dimensão do espaço do raio é cinco. contudo, a radiância é
constante ao longo de uma dada direcção no espaço livre, ou seja, onde não há
descontinuidades devido à intersecção com objectos ou intervenção de um meio
participante. assim, a radiância é constante ao longo de cada direcção.
um dos objectivos para a utilização da técnica dos light fields (lfs) foi permitir maior
liberdade no intervalo de vistas possíveis. de facto, as técnicas anteriores ao image
based rendering baseavam-se na utilização de mapas de ambiente para capturar a
luminosidade proveniente de um mapa de texturas. a luz que incide num ponto e que é
proveniente de todas as direcções é gravada na forma de um mapa de ambiente.
a sua utilização original teve como objectivo primário a eficiente aproximação de
reflexões de um ambiente numa superfície. no entanto, os mapas de ambiente também
podem ser utilizados para rapidamente se reproduzir qualquer vista exterior do ambiente
numa localização fixa, mas com uma orientação variável, sendo estes os fundamentos
básicos do sistema apple quicktime vr [apple, 2007]. neste sistema, os mapas de
ambiente são criados em localizações chave na cena e o utilizador pode mudar
discretamente de orientação, sendo que a direcção de vista muda continuamente.
a maior limitação dos sistemas de síntese de imagem que utilizam mapas de ambiente é
o ponto de vista ser fixo, havendo, no entanto, alternativas baseadas na interpolação
sobre a vista. a maioria destes sistemas requer valores de profundidade para cada pixel
capítulo 4: light fields 42
no mapa de ambiente, o que facilmente é obtido se estes são imagens sintéticas. com o
valor de profundidade é possível reprojectar pontos nos mapas de ambiente de
diferentes imagens. o grande desafio da abordagem é “preencher os buracos” quando
áreas prévias que estavam ocultas nas imagens fonte se tornam visíveis na imagem
destino.
num light field, representa-se a radiância como uma função de direcção e posição, em
regiões de espaço livre de objectos que podem estar a ocultar a cena. assim, no espaço
livre, o light field é uma função de dimensão 4 e cada imagem corresponde uma fatia
de dimensão 2. criar um light field através de imagens corresponde a inserir fatias 2d
numa representação 4d e, analogamente, gerar novas vistas corresponde a extrair e
amostrar uma fatia.
gerar uma nova imagem de um light field é diferente dos métodos de interpolação
anteriores e baseia-se num conjunto de três passos. primeiro, uma nova imagem é
geralmente formada através de diferentes pedaços das imagens originais, e não precisa
de ser igual a qualquer uma delas. depois, informação do modelo é necessária para
extrair valores da imagem, como valor de profundidade ou correspondências de
imagens. finalmente, a geração de imagem envolve simplesmente amostragem, um
processo linear simples.
há grandes desafios na utilização de light fields para visualizar cenas 3d numa
plataforma gráfica. primeiro, a decisão da parametrização e representação do light
field, relacionada com a escolha do padrão de amostragem para o light field. em
segundo, a aquisição e a geração do próprio light field. em terceiro, há o problema da
rápida geração de diferentes vistas. isto requer que a representação da fatia para
representar os raios através de um ponto deverá ser de fácil extracção, e que essa fatia
seja amostrada rigorosamente para evitar problemas na imagem final. a óbvia
desvantagem desta abordagem é a grande quantidade de dados que é necessária, mas
que, devido à sua coerência, poderá ser bastante comprimida.
4.1 definição e representação do light field
um light field é uma técnica de image based rendering que utiliza múltiplas vistas de
uma cena para gerar novos pontos de vista. o processo consiste em capturar a luz que
chega da cena num conjunto de dados, como já foi referido anteriormente. a condição
de luz de uma cena pode ser caracterizada através da dimensão 5 da plenoptic function
que descreve o fluxo de luz (radiância) em cada ponto no espaço de dimensão 3 (3 graus
de liberdade) em qualquer direcção (2 graus de liberdade). assumindo um objecto
limitado e um espaço envolvente transparente, a radiância não muda ao longo de uma
capítulo 4: light fields 43
linha de vista. isto reduz o espaço de dimensão 5 a um espaço de dimensão 4. os raios
que especificam a direcção do fluxo de luz são parametrizados pelas coordenadas da
intersecção da linha com dois planos paralelos, plano de câmara e plano focal, sendo
esta representação, a primeira a ser adoptada. um exemplo em dimensão 2 é mostrado
na figura 17.
figura 17: representação discreta de um light field (um light slab).
por convenção, o sistema de coordenadas no plano de câmara é (u,v), no plano focal é
(s,t). uma linha orientada é assim definida unindo um ponto no plano (u,v) a um ponto
no plano (s,t). na prática, u, v, s e t foram restringidos a valores normalizados e os
pontos em cada plano ficam restritos a um quadrilátero convexo. esta representação é
conhecida por light slab. intuitivamente, um light slab representa um feixe de luz que
entra num quadrilátero e sai por outro.
esta representação permite colocar um dos planos no infinito, o que poderá ser
conveniente uma vez que, assim, cada linha poderá ser parametrizada por um ponto e
uma direcção. desta forma possibilita-se a construção de light fields a partir de
imagens ortográficas ou de imagens com um campo de vista fixo. uma grande
vantagem desta representação é a eficiência nos cálculos geométricos, envolvendo
simplesmente álgebra linear.
a estrutura dos planos (u,v) e (s,t) pode ser conseguida colocando o eixo óptico da
câmara de forma perpendicular aos planos. o plano focal pode ser interpretado como o
plano imagem da câmara, correspondendo (s,t) à posição do pixel. o 4-uplo (u,v,s,t)
contem a informação da cor do pixel (s,t) na posição de vista (u,v). para obter uma
plano câmara (u,v)
planofocal (s,t)
objecto
capítulo 4: light fields 44
descrição completa que permita uma posição arbitrária do ponto de vista podem ser
utilizados 6 pares de planos cada um alinhado num lado de um cubo.
a estrutura assim definida denomina-se light field. o conceito de lumigraph
apresentado por [gortler et al., 1996] é idêntico, apesar de conter mais informação,
envolvendo alguma geometria da cena. o light field (de facto um subconjunto deste) é
assim representado por l(u,v,s,t) e discretizado por todas as linhas possíveis entre os
dois planos paralelos definidos por grelhas rectangulares impostas em cada plano. o
plano (u,v) é subdividido em quadrados, onde cada vértice forma o centro de projecção
efectuada sobre o plano (s,t). um light slab é formado a partir de dois planos, paralelos
entre si, reticulados que servem para indexar com coordenadas (u,v,s,t) raios de luz que
irradiam da cena. de modo a cobrir todas as possíveis direcções dos raios, são
necessários seis light slabs.
uma vez construído o light field, este pode ser utilizado para sintetizar uma imagem
através de uma câmara virtual que não corresponde ao conjunto de câmaras no plano uv.
uma nova imagem pode ser formada através da amostragem do conjunto de linhas
provenientes do ponto de vista, nas direcções requeridas.
a abordagem dos light fields foi projectada como um método para criar novas vistas
de imagens de cenas reais, supondo que foram tiradas fotografias digitais sob condições
restritas formando um conjunto de pontos de vista e direcções associadas com os planos
uv. claramente este conjunto de imagens pode ser utilizado para criar um light field.
4.2 geometria básica e sistema de coordenadas
a geometria básica dos planos de projecção, os objectos e as suas coordenadas podem
ser visualizadas na figura 18.
todos os objectos no espaço 3d x = [x y z]t
são referenciados relativamente ao sistema
de coordenadas que é localizado no meio do plano da câmara. ambos os planos, de
câmara e focal, são paralelos ao plano (x,y) no sistema de coordenadas 3d (mundo). a
distância entre os planos corresponde ao comprimento focal f. com esta representação,
as coordenadas (u,v) e (s,t) do light field correspondem às coordenadas 3d (u,v,0) e
(s,t, -f) respectivamente. o ponto do objecto x será projectado no ponto (s,t) no plano
focal de acordo com as equações:
s(u,v) = u-f x/z t(u,v) = v – f y/z (eq 28)
capítulo 4: light fields 45
figura 18: sistema de coordenadas dos pontos nos planos uv e st.
onde u e v descreve o centro de projecção da vista particular no plano (u,v). as
coordenadas do mundo do plano focal (s,t) poderão ser transformadas em coordenadas
do pixel (s,t) utilizando factores de escala sx e sy:
s = sxs (eq 29)
t = syt
desta descrição advém o facto de ser possível fazer transformações lineares de
coordenadas do sistema tridimensional para o sistema utilizando os planos de câmara e
focal.
4.3 rendering: interpolação
supondo que o plano uv é discretizado com uma grelha m*m, e o plano st com n*n,
então o light field irá consistir de m2
imagens perspectivas, cada com uma resolução
n2
(ilustrado em 2d, na figura 19). o ponto uv marca um centro de projecção e terá uma
imagem associada com o volume de vista correspondente. todos os raios convergentes
neste centro de projecção terão por isso uma radiância associada determinada por esta
imagem que poderá ter sido capturada com uma câmara real colocada no ponto (u,v) ou,
em casos de cenas virtuais, sintetizada com um centro de projecção (cop) colocado no
mesmo ponto. o cop é mudado para cada ponto no plano (u,v) completando assim o
light slab. todo o processo deverá ser repetido para cada um dos restantes light slabs,
formando-se o light field.
objecto
•
plano (u,v)
(s,t)
(0,0) •
••
plano (s,t)
z
(u,v)
(0,0)
(0,0,s,t)
(u,v,0,0)
x
capítulo 4: light fields 46
figura 19: uma imagem é criada para cada ponto no plano st.
uma vez criado, o light field poderá ser utilizado para sintetizar imagens de câmaras
virtuais com posições e orientações fora do convex hull da cena.
figura 20: síntese de imagem para um novo ponto de vista.
a figura 20 mostra os planos uv e st e uma possível posição e orientação da câmara
virtual. cada raio proveniente da câmara virtual intersecta os planos st e uv. por
exemplo, o raio r intersecta o plano st em (s0,t0) e o plano uv em (u0,v0). ao pixel da
máquina virtual, correspondente ao raio r, será atribuído o valor de radiância
l(u0,v0,s0,t0). por outras palavras, cada raio primário gerado pela câmara é utilizado para
(u,v)
(s,t)
janela do plano de visualização no plano st
(u,v)
(s,t)
r
plano câmara
centro de projecção
(s0,t0)
(u0,v0)
capítulo 4: light fields 47
procurar o raio mais próximo no espaço 4d de raios correspondentes do light field,
assumindo-se que as radiâncias têm o mesmo valor (propagação em espaço livre)
este método pode ser implementado eficientemente utilizando técnicas de texture
mapping. a figura 21 mostra um ponto (ui ,vj) da grelha no plano uv, e um quadrado
contendo todos os pontos no plano que serão aproximados por este ponto particular.
agora o quadrado projecta os pontos a,b,c,d no plano st. correspondendo a (ui ,vj) há
uma imagem no plano st. esta imagem poderá ser usada como uma textura para
sintetizar o quadrado uv para (ui ,vj), com as coordenadas de textura dadas por a,b,c,d.
nesta abordagem o quadrado correspondendo a cada ponto da grelha uv é sintetizado
utilizando um texture map da imagem correspondendo ao ponto da grelha. isto envolve
a procura do conjunto de coordenadas de textura para cada quadrado, mas uma vez que
os quadrados vizinhos partilham pontos grelha o número de projecções necessárias é
aproximadamente o número de quadrados desenhados. é claro que nem todos os m2
quadrados serão sintetizados, dependendo do volume da vista da câmara.
figura 21: utilização de texture mapping.
na prática, a técnica simplista descrita irá conduzir, inevitavelmente, a um aliasing
significativo. um esquema alternativo baseia-se na interpolação quadrilinear de
radiância. há quatro vértices vizinhos do ponto no plano uv, e quatro vizinhos no plano
st, como é mostrado na figura 22. considere-se em primeiro lugar a interpolação em u,
com todos os outros parâmetros fixos; a equação 30 mostra, nestas condições, a
expressão de u como uma combinação de u0 e u1.
s
t
u
(ui,vj)
v
a b
d
c
•
centro de projecção
capítulo 4: light fields 48
figura 22: interpolação quadrilinear.
1
01
0
0
01
1
u
uu
uu
u
uu
uu
u 





−
−
+





−
−
= (eq 30)
ou, de outra forma,
1100 uuu αα += onde 110 =+αα (eq 31)
a interpolação quadrilinear aplicada ao light field toma o pressuposto que a própria
função l é uma transformação linear. assim, aplicando-se este princípio à equação 30,
obtém-se:
),,,(),,,(
),,,(),,,(),,,(
0001100000
0001
01
0
0000
01
1
000
tsvultsvul
tsvul
uu
uu
tsvul
uu
uu
tsvul
αα +=






−
−
+





−
−
=
(eq 32)
repetindo o argumento para cada parâmetro vem:
),,,(),,,(
1
0
1
0
1
0
1
0
lkji
i j k l
lkji tsvultsvul ∑∑∑∑= = = =
= δγβα (eq 33)
onde lkj δγβ ,, são definidos de forma semelhante a iα na equação 31, e correspondem
a v, s e t respectivamente. agora todos os valores interpolados podem ser encontrados
utilizando um método similar para encontrar coordenadas de textura interpoladas
durante o processo de rendering dos quadrados uv e st como polígonos.
gortler [gortler e al. 1996] mostrou que este método não pode ser implementado
usando hardware de mapeamento de texturas. o suporte para interpolação quadrilinear
em (ui,vj) expande-se fora até abcd na figura 23, e por isso a grelha de pontos vizinhos
vai ter sobreposições. considerem-se os seis triângulos que contornam o ponto na
grelha. gortler mostrou que sendo cada um destes triângulos sintetizado com texture
mapping e utilizando alpha blending, com α=1 na grelha de pontos e α=0 nos restantes
vértices do triângulo, equivale a efectuar interpolação linear em uv e interpolação
bilinear em st [gortler et al. 1996]. portanto, sugere que os resultados não são
visivelmente distinguíveis da interpolação bilinear total.
s0
t0
•(u,v)
u0
v0
v1
u1
t1
s1
(s,t) •
capítulo 4: light fields 49
figura 23: o suporte para a base quadrilinear.
gortler [gortler et al. 1996] mostraram ainda que, existindo alguma informação
geométrica associada ao conjunto dos raios de light field, é possível um
aperfeiçoamento da estimação da radiância. uma análise mais detalhada da rapidez do
processo de rendering, em particular dados cruzando a qualidade de imagem e tempo de
processamento, pode ser encontrada em [sloan, 1997].
4.4 representações de light fields
a representação apresentada, que recorre a dois planos paralelos (2pp), tem vantagens
computacionais, especialmente relacionadas com o armazenamento (imagens
rectangulares) e com a utilização de hardware de síntese de imagem para a
reconstrução. contudo, não apresenta uma distribuição uniforme dos raios no espaço
4d. por outras palavras, se se pensar em raios arbitrários no espaço, nem todos os raios
possuem o mesmo grau de aproximação de representação no espaço de light field. na
prática, significa que a qualidade da imagem sintetizada é uma função do ponto de vista
e da direcção de vista: pontos de vista próximos do centro do plano uv, e direcções
ortogonais a este plano, resultam em melhores imagens. uma análise mais profunda da
representação 2pp como um espaço 4d pode ser encontrada em [gu et al. 1997].
camahort e fussel, [camahort et al., 1999] apresentaram um estudo para três
representações alternativas de light fields, a já conhecida 2pp, a representação através
de duas esferas (2sp), e a representação através de uma direcção e um ponto (dpp). a
representação 2sp envolve colocar uma esfera à volta de uma cena, e fazer a partição da
esfera numa grelha uniforme. então todas as ligações entre todos os vértices na esfera
formam a parametrização. a representação dpp recorre também a colocação de uma
esfera à volta da cena. depois escolhe-se um ponto aleatório na superfície da esfera. isto
define um vector desde a origem até esse ponto.
a b
cd
(ui ,vj)
capítulo 4: light fields 50
uma representação diferente de duas esferas foi introduzida em [ihm et al., 1997].
nesta representação era colocava uma esfera discretizada à volta da cena, mas com um
processamento diferente, baseado na definição de direcções com base em discos
orientados colocados no centro e os vértices da esfera.
uma representação diferente baseada em duas esferas foi ainda introduzida em [ihm et
al., 1997]; nesta representação é colocada uma esfera à volta da cena e um conjunto de
esferas, mais pequenas, na superfície do objecto para representar direcções.
figura 24: parametrizações do light field (à esquerda dois planos, no centro
parametrização esférica e à direita representação através de um ponto e uma
direcção).
as conclusões de camahort e fussel [camahort et al., 1999], após uma análise
aprofundada dos diferentes esquemas (bem como uma discussão de uniformidade),
mostram que a abordagem direcção e ponto resulta em menos bias rendering e permite
correcções que são mais simples de aplicar.
na representação 2sp, há um número de assuntos práticos a considerar, tais como o
local a colocar os planos uv e st. idealmente, a geometria da cena deverá estar o mais
próxima possível do plano st. todavia, em termos práticos, significa que os light fields
podem não representar, de forma adequada, cenas de profundidade significativa. uma
distribuição de raios que seja adequada para representar superfícies próximas poderá
não ser suficiente para representar superfícies afastadas.
uma outra questão importante consiste em definir a resolução a atribuir para m e n. o
último será mais relevante, uma vez que determina o grau de aproximação da geometria
da cena (quanto maior for a resolução da cena no plano st, mais exacta é a sua
representação). [levoy e hanrahan, 1996] ao sintetizar imagens com resoluções
256256 × , concluem que os valores n=256 e m=32 são suficientes.
assumindo, por exemplo, que é essa a resolução utilizada, então um light slab
constituir-se-á de 26
2 (= 256 x 256 x 32 x 32) raios. suponhamos que cada raio se
dois planos esférica ponto e direcção
capítulo 4: light fields 51
caracteriza por 3 bytes, então serão necessários 192 mb de memória para o light slab, e
mais de 1 gb para o total light field (6 light slabs). note-se que isto é calculado para
cenas estáticas e de relativa baixa resolução, tornando claro que um esquema de
compressão é necessário.
levoy e hanrahan [levoy e hanrahan, 1996] utilizaram, para o efeito, vector
quantization [gesho e gray, 1992]. trata-se de um esquema de compressão onde os
dados são partidos em clusters, cada um representado por um vector encontrado durante
a fase de treino. cada vector corresponde a um codebook que guarda índices dos
membros do cluster que representa. a descompressão é uma operação necessariamente
rápida e, no caso, levoy e hanrahan mostraram rácios de compressão para além de
100:1 com actualização da imagem em real time ou com frame rate aceitável. com este
tipo de taxas de compressão torna-se possível uma utilização prática da técnica dos
light fields.
4.5 mais desenvolvimentos no estudo dos light
fields
desde as primeiras publicações, em 1996, das técnicas light field/lumigraph, que o
interesse por esta teoria se tem mantido. em 1999, patrick ohly [patrick ohly, 1999]
alargou o conceito e apresentou os extended light fields com aplicações em linux. os
desenvolvimentos mais significativos foram orientados para problemas com cenas de
profundidade pouco significativa. isaken [isaken et al., 2000] apresentou uma discussão
de como ultrapassar este problema, adicionando efeitos de profundidades de campo e
mostrando de como os lfs podem ser usados como base dos sistemas display de auto-
stereoscopic.
pela sua natureza, os light fields são mais apropriados para cenas estáticas, em
detrimento de cenas interactivas. contudo, steiz [steiz et al., 1998] permitiu algum grau
de interacção mostrando como era possível editar uma imagem de uma cena e propagar
as mudanças a todas as outras imagens, mantendo a consistência do conjunto.
um surface light field é um lf que consiste de raios que emanam das superfícies, em
princípio o conjunto de raios que saem desse ponto com a sua radiância associada.
[wood et al., 2000] mostrou como construir, editar e visualizar esse tipo de light fields
para cenas reais.
como afirmado anteriormente, a teoria de representação de light fields foi considerada
em [camahort et al., 1999]. num outro estudo, chai, thong, chan e shum [chai et al.,
2000] providenciaram uma análise completa de requisitos para a amostragem. incluía
capítulo 4: light fields 52
uma curva de amostragem mínima que relacionava a complexidade da cena, a resolução
do output e a amostragem da imagem.
estudos mais recentes, nomeadamente, em 2006, [ahrenberg e magnor, 2006]
apresentaram uma base de trabalho sobre light field rendering baseado em matrizes
ópticas. foi apresentado um sistema de rendering em tempo real para light fields
comprimidos e não comprimidos utilizando matrizes ópticas, ou seja, um conjunto de
operadores relacionados com propagação de luz, lentes finas e dielectric interfaces. as
dielectric interfaces podem ser representadas utilizando matrizes o que permite modelar
um light field através de uma série arbitrária de operadores ópticos conduzindo
transformações lineares nos seus elementos.
num outro campo, os progressos continuam em matéria de recolha de imagens, como
seja o protótipo de câmara de aquisição de light fields [liang et al., 2007] e,
posteriormente, modificações sobre a técnica, nomeadamente o recente dispositivo
interactivo de visualização de 360º light fields. o visualizador utiliza programação
standard para sintetizar mais de 5000 imagens por segundo de gráficos 3d interactivos
projectando vistas de 360º com 1,25º de separação até 20 actualizações por segundo.
outras linhas de orientação de estudo têm sido seguidas, como sejam: a compressão
[ramanathan, 2005], a aplicação à visualização de imagens [dansereau, 2003], e de
fotografias digitais [ng, 2006], assim como novos métodos de manipulação e integração
de lfs [chen, 2006].
4.6 sumário do capítulo
os conceitos associados aos light fields são pontos fulcrais deste trabalho. assim
sendo, este capítulo pretendeu esclarecer o significado de light field, mostrar os
primeiros passos dados para a sua aplicação, qual a componente matemática e teórica
associada e apresentar as suas diferentes possibilidades de representação.
o conceito de light field e a sua aplicação são, no entanto, complexos. como tal, no
capítulo seguinte será analisado o projecto e implementação de uma aplicação didáctica
simples de light fields que permita compreender melhor o conceito a utilizadores com
distintos graus de conhecimento na área da computação gráfica.
capítulo 5
5. aplicação didáctica de light
fields
de modo a permitir uma fácil compreensão do conceito de light fields, foi
desenvolvida uma aplicação didáctica composta por um sítio web e uma aplicação de
visualização em ambiente windows para computadores pessoais. o sítio web contém
uma descrição detalhada das componentes teóricas e procedimentos desde os conceitos
necessários até à criação dos light fields. a aplicação windows permite uma
visualização interactiva de lfs previamente construídos, complementando deste modo
o sítio web, na aprendizagem do conceito.
inicialmente, foi utilizado um pacote de software de construção de light fields [levoy,
1996] executável em sistema linux ou sgi (silicon graphics, inc.) [sgi, 2007], que
serviu de base ao trabalho. este pacote permite a geração de light fields com distintas
parametrizações, possibilitando deste modo a obtenção de dados para a aplicação de
visualização desenvolvida.
neste capítulo descreve-se a base de trabalho utilizada, referindo o início do projecto, as
actualizações elaboradas e utilizadas de modo a ser possível efectuar a geração de lfs
adequados à realização do estudo e análise dos resultados obtidos. descreve-se também
a arquitectura, potencialidades e desenvolvimento da aplicação windows de
visualização de lfs e o modo de criação do sítio web que permitiram a realização do
estudo estatístico que será apresentado no capítulo seis.
ao elaborar a aplicação didáctica houve necessidade de contextualizá-la perante os
modelos educacionais existentes na literatura. foi também necessário responder à
questão de como escolher uma ferramenta de gestão de conteúdos de acordo com o
modelo de aprendizagem seleccionado. assim sendo, no início deste capítulo são
apresentados e descritos os modelos pelo quais os indivíduos se regem para utilizar e
obter novos conhecimentos e justificado o modelo educacional seleccionado para o
trabalho.
capítulo 5: aplicação didáctica de light fields 54
5.1 modelos educacionais
um modelo pode ser definido como uma representação ou interpretação simplificada da
realidade ou uma interpretação de uma parte de um sistema, ideia, evento, objecto ou
processo, segundo uma determinada estrutura de conceitos mentais ou experimentais.
normalmente, para estudar um determinado fenómeno complexo, podem-se criar
diversos modelos com diferentes características.
um modelo educacional apresenta uma representação simplificada de um processo ou
sistema educacional analisando-o segundo uma dada construção de conceitos mentais
ou experimentais. todos os indivíduos constroem modelos com conhecimentos prévios
e com o objectivo de acomodar a nova informação podendo assim ser compreendida a
importância da utilização de modelos no processo de ensino-aprendizagem [gomes et
al., 2006]. os modelos educacionais podem ser classificados em quatro tipos [gomes et
al., 2006] [gilbert e boulter, 1998]:
• modelo mental – representação pessoal e privada de um objecto;
• modelo expresso – versão do modelo mental que é expressa por um indivíduo
através da acção, da fala ou da escrita;
• modelo consensual – modelo expresso que foi submetido a testes pelo grupo
social, por exemplo, pertencente à comunidade científica e sobre o qual se
concorda que apresenta algum mérito;
• modelo pedagógico – modelo especialmente construído e utilizado para auxiliar
na compreensão de um modelo consensual.
em relação a este último tipo de modelo inserem-se os três modelos a seguir descritos
[baumgartner e hafele, 2005]:
• transferência de conhecimento: neste modelo, a origem do conhecimento do
aluno baseia-se no conhecimento do professor. o professor compreendendo que
os alunos precisam de aprender, centra a sua tarefa em transferir este
conhecimento ao aluno da forma mais simples. o conhecimento transferido é
extraído do professor, com preparação didáctica, para que os alunos possam não
só absorver o conteúdo rapidamente, mas também memorizá-lo a longo prazo.
este modelo tem algumas semelhanças com o behaviorismo [fosnot, 2000];
• aquisição, compilação e acumulação de conhecimento: este modelo
pressupõe que a aprendizagem é um processo activo, em que o aluno tem de
planear, rever e reflectir. o papel dos alunos é neste caso activo sendo esta uma
condição necessária deste processo. no ensino de transferência de
conhecimento, o professor não está interessado em controlar ou observar o
capítulo 5: aplicação didáctica de light fields 55
processo de aprendizagem em si mas sim nos resultados finais do processo. pelo
contrário, neste tipo de ensino, o processo, os seus passos intermédios, as
dificuldades e resultados são monitorizados pelo professor. os alunos não
recebem do professor uma resposta positiva ou negativa, mas sim o professor
tenta ajudar o aluno a superar hipóteses erradas ou atitudes erradas de
aprendizagem e a melhorar o processo de reflexão e aquisição do modelo mental
do tema. este ensino assemelha-se ao cognitivismo [fosnot, 2000];
• desenvolvimento, criação e construção de conhecimento: no modelo do
ensino anterior, todos os problemas e tarefas são apresentados pelo professor.
mas neste modo de ensino é necessário criar ao alunos um ambiente de
aprendizagem especial e estimulante no qual os métodos tradicionais não
funcionam. no modelo de ensino de desenvolvimento, criação e construção do
conhecimento, tanto o professor como o aluno colocam-se numa situação de
aprendizagem cujos resultados não são anteriormente determinados. ambos têm
de dominar a situação presente e as óbvias diferença professor/aluno, em que o
primeiro possui mais experiência e conhecimento e está melhor preparado para
reflectir sobre situações complexas (por exemplo conceber experiências). este
tipo de ensino está intimamente ligado ao construtivismo [glasersfeld, 1996].
perante estes tipos de modelos deve acrescentar-se a utilização de ferramentas cada vez
mais poderosas e que estão mais facilitadas para a sua obtenção e utilização. o advento
da multimédia no ensino veio complementar os modelos educacionais já existentes e
criar novos paradigmas. no habitual processo de instrução, igualmente aproveitadas
pela instrução multimédia, podemos encontrar as seguintes tarefas [faria et al., 2003]:
• análise da tarefa;
• envolvimento e participação activa do aluno;
• tempo de aprendizagem individual.
neste processo, o aluno é incentivado à memorização da informação e aplicação de
habilidades/capacidades na resolução de problemas. o método falha essencialmente ao
não criar no aluno relações de compreensão.
neste contexto é importante referir as conclusões da psicologia cognitiva relativas ao
conceito de integração de conhecimentos como processamento da informação e
aquisição de conhecimentos, e do construtivismo [fosnot, 2000] referentes à noção que
o conhecimento não pode ser lançado sobre o aluno, apenas integrado por ele na sua
reconstrução mental face à nova informação. o processo de aprender liberta-se cada vez
mais da ideia de recepção passiva de conhecimentos. cada vez mais a aprendizagem é
caracterizada por um processo activo, no qual o indivíduo integra a nova informação na
capítulo 5: aplicação didáctica de light fields 56
sua rede semântica, reestruturando nesse processo os seus modelos mentais e
cognitivos.
em resumo, desloca-se o ênfase do “saber que” (conhecimento declarativo) para o
“saber como” (conhecimento de procedimentos) e “saber por quê” (conhecimento
contextual).
neste novo paradigma, são reforçadas sobretudo duas formas de conhecimento: o
conhecimento científico da aprendizagem (e as ciências relacionadas) e o conhecimento
prático baseado no ensinar, no oposto da investigação científica formal.
o ensino multimédia caracteriza-se pela utilização de uma série de ferramentas que
visam o desenvolvimento do processo de criação de conhecimento e formação do
indivíduo, nomeadamente através da exploração das suas capacidades mentais e da sua
estrutura cognitiva. este ensino, essencialmente colaborativo e responsabilizador (tanto
na auto avaliação como na avaliação partilhada), aposta na participação activa do
indivíduo, na flexibilidade do seu modelo, na óbvia utilização de suportes tecnológicos,
e no desenvolvimento de capacidades de comunicação interpessoal.
as suas principais áreas de intervenção vão além da exposição de informação (como
objecto principal do método de ensino) e dos suplementos informativos (como mero
suporte ao método de ensino). a multimédia alberga em si a possibilidade do estudo
independente (e consequente formação individual) e da investigação (devido à partilha e
armazenamento da informação). a outra grande inovação do ensino multimédia deriva
da introdução de um novo modelo temporal e espacial: o indivíduo interage agora com a
informação sem necessidade de uma presença física e espacial fixa e pré-determinada.
a preocupação pela didáctica tem uma longa tradição e foram desenvolvidas várias
perspectivas e definições de educação/instrução [faria et al., 2003] [issing, 1994]
[issing, 2003]. uma definição típica consiste na didáctica como teoria de conteúdos
educacionais [klafki, 1974]. a didáctica como teoria e prática de ensino e
aprendizagem é outra definição apresentada por [jank e meyer, 1994]. a didáctica pode
ser também definida como aplicação de teorias psicológicas de aprendizagem ao
planeamento, desenvolvimento, condução e avaliação sistemática do processo de
aprendizagem.
a didáctica multimédia é concebida como uma subdivisão da didáctica geral com
ênfase especial no uso integrativo de multimédia no ensino e aprendizagem. adere, no
entanto, a muitos conceitos da tecnologia instrutiva utilizados ainda hoje na elaboração
de instrução baseada em computador (computer based training - cbt).
não é o ensino o centro de interesse, mas a aprendizagem. o processo de aprendizagem
já não pode ser entendido como recepção mais ou menos passiva de informação, mas
como uma aquisição activa de conhecimento pelo estudante, integrando a informação
capítulo 5: aplicação didáctica de light fields 57
nova na sua rede semântica, elaborando e reestruturando os seus modelos mentais e
estruturas cognitivas [kozma, 1991].
como referido, anteriormente os objectivos de aprendizagem são hoje colocados mais
frequentemente no domínio de conhecimento de procedimentos (saber como) e de
conhecimento contextual (saber por quê, quando e onde) do que no até agora enfatizado
domínio de conhecimento declarativo (saber que) [tennyson e nielsen, 1998]. isto
significa que a ênfase mudou definitivamente do conhecimento de factos para a
aquisição de habilidades e estratégias cognitivas e, como tal, os processos de
aprendizagem multimédia devem seguir esta tendência.
5.2 interactividade e visualização
o ensino multimédia baseia-se na interactividade e na visualização como conceitos
chave para produzir o desejado efeito de conhecimento e compreensão no indivíduo,
privilegiando a aprendizagem interactiva individualizada.
hammond distingue três dimensões do processo educativo que envolve a
interactividade [hammond, 1993]:
• controlo: o nível ou grau de exposição da informação pelo sistema ao indivíduo;
• envolvimento: extensão da participação do indivíduo no processo de
aprendizagem (participação activa e não passiva);
• síntese: capacidade do indivíduo de produzir conhecimentos a partir da
informação disponibilizada (aprender com interacções da troca de informação e
não com o memorizar dessas informações).
na figura 25 é apresentada de forma esquemática a interligação das dimensões e o grau
de associação entre o controlo, envolvimento e síntese.
capítulo 5: aplicação didáctica de light fields 58
figura 25: grau do controlo, síntese e envolvimento de conhecimento em
aprendizagem baseada na utilização do computador (adaptado de [hammond, 1993]).
no que respeita à visualização, o ensino multimédia baseia-se em vários suportes,
privilegiando o uso da visualização e das técnicas de apresentação da informação. esta
visualização serve dois grandes objectivos:
apresentar ao indivíduo experiências cuja realidade física ou temporal lhe é
impossível de experimentar, ou cujo tamanho físico lhe seria demasiado
pequeno ou grande para percepcionar;
permitir a percepção física de objectos e conceitos abstractos, como teorias, e
modelos.
sendo a percepção visual a que produz mais efeitos sobre a motivação do indivíduo,
além de estimular a imaginação deste, desencadeia o processo cognitivo que o indivíduo
necessita para a criação de conhecimento, superando as deficiências cognitivas que
possa ter numa qualquer tarefa particular que tenha em mãos. como é abordado na
psicologia da aprendizagem, toda a informação apresentada no modo pictórico é
assimilada de forma mais imediata pelo indivíduo. por outro lado, a conjugação de texto
e imagem produz os efeitos mais concretos e fáceis de activar na memória e aplicar na
realidade, motivo pelo qual a relação entre os dois deverá ser a mais adequada à
realidade que se pretende ensinar.
5.3 modelo da aplicação
a aplicação multimédia, desenvolvida no âmbito deste trabalho foi construída de modo
a conter um vasto conjunto de potencialidades didácticas que permitam uma simples
compreensão do conceito de light field. esta aplicação insere-se no modelo
educacional, mais especificamente partilha métodos descritos no modelo de
professor/sistema
apresentação criação
controlo
activo
aluno
síntese
envolvimento
passivo
capítulo 5: aplicação didáctica de light fields 59
desenvolvimento, criação e construção de conhecimento e de aquisição, compilação
e acumulação de conhecimento. o aluno é um elemento activo no processo, tendo
acesso aos conceitos ligeiramente encaminhados pelo professor que faz o levantamento
das dificuldades ao longo da aprendizagem. também é providenciada uma aplicação,
não só por si estanque de conceitos, sendo dada a liberdade para ser explorada pelo
aluno, no contexto do seu processo de aquisição de conhecimento.
assim sendo, o aluno é um elemento activo, porque tem de procurar e envolver-se no
estudo. o professor efectua a análise das respostas às perguntas que foram apresentadas
de forma estruturada até atingir o conhecimento final. a disponibilização do sítio web
com os conceitos base, associada à aplicação didáctica, possibilita classificar o controlo
simultaneamente da responsabilidade do professor/sistema e do aluno. finalmente, em
relação à capacidade do indivíduo produzir e adquirir conhecimentos a partir da
informação disponibilizada deverá ser, manifestamente, de criação. desta forma,
relativamente ao modo de visualização, o objectivo consistiu num posicionamento no
cubo de hammond no ponto assinalado na figura 26.
figura 26: nível de controlo, síntese e envolvimento do utilizador.
este posicionamento, perto do canto inferior direito com ligeira profundidade na parte
frontal do cubo de hammond, define um processo educativo com um envolvimento
manifestamente activo, controlo do processo dado maioritariamente ao aluno e síntese
baseada maioritariamente em criação (como em todas as aplicações educativas baseadas
em pesquisa na internet).
passivo professor/sistema
apresentação criação
controlo
envolvimento
activo
aluno
síntese
●
capítulo 5: aplicação didáctica de light fields 60
5.4 aplicação base utilizada – lightpack 1.0
em seguida é apresentada uma breve descrição sobre aspectos da aplicação base
utilizada, nomeadamente, o modo de criação, visualização de light fields e arquitectura
do sistema.
5.4.1 introdução
a primeira implementação do conceito de light fields, lightpack 1.0 [levoy, 1996], foi
inicialmente aplicada em plataforma sgi. a ferramenta desenvolvida por marc levoy e
pat hanrahan é composta por duas aplicações:
componente de geração de light fields: lifauth (light field authoring), que
permite criar através de um conjunto de imagens o ficheiro com extensão “.lif”
contendo um lf com determinada parametrização;
componente de visualização de light fields: lifview (light field viewer) que
permite visualizar o light field, a partir de um ficheiro “.lif” previamente
gerado.
a geração de lfs só era possível em sgi, enquanto que o lifview para além deste
sistema funcionava também, de modo muito básico, em windows [levoy, 1996].
um novo desenvolvimento da aplicação, com a implementação dos extended light
fields, foi realizado por patrick ohly [ohly, 2004] a partir da implementação existente
lightpack 1.0. a fonte de dados, na versão de levoy, dependia de diversas bibliotecas e
características exclusivas da plataforma sgi. assim, um dos objectivos principais da
aplicação dos extended light fields foi a conversão para linux e opengl+glut
[glut, 2005] [opengl, 2005]. as aplicações foram convertidas para linux [ohly,
2004], alterando as bibliotecas com implementações standard. a conversão revelou-se,
no entanto, pouco fiável, sendo de muito difícil instalação em grande parte das
distribuições linux disponíveis à data5
. a potencialidade de visualização de lfs em
ambiente windows foi também perdida com esta conversão para linux sendo, deste
modo, largamente reduzido o potencial didáctico da aplicação.
5
na realidade, após meses de interacção com os autores da aplicação, foi necessário recorrer a um
especialista em sistema linux e programação em linguagem c para conseguir instalar a aplicação.
capítulo 5: aplicação didáctica de light fields 61
5.4.2 criação de um light field
no software de extended light fields, o processo de criação de um light field inicia-se
com a geração de todas as imagens, o que se revela uma tarefa extremamente
trabalhosa, difícil e que ocupa muito espaço de armazenamento, já que as
transformações de vista devem ser as correctas para cada imagem.
a base de dados de imagens assim criada (armazenada num ficheiro “.raw”), em
conjunto com a sua geometria (armazenada num ficheiro “.lid”) pode ser utilizada para
gerar o light field correspondente (que será armazenado num ficheiro “.lif”).
a partir da aplicação do software de extended light fields, na plataforma linux, é
portanto possível construir novos light fields com distintos parâmetros. estes
parâmetros incluem, entre outros, qualidade e tamanho das imagens originais, nível de
resolução do lf resultante, nível de compressão, afastamento dos planos uv e st, tipo de
rendering e tipo de interpolação.
5.4.3 visualização de um light field
a aplicação de visualização dos extended lfs possibilita visualizar os lfs gerados, em
ambiente linux. a parte mais relevante de mudança foi a passagem de irisgl para
opengl em ambiente linux. foi também estendida de modo a mostrar alguma
informação básica sobre os extended light fields.
a aplicação, embora limitada à visualização, em sistema linux, de um único lf
indicado na linha de comando, contém, no entanto, algumas potencialidades interactivas
relevantes. entres estas, incluem-se a possibilidade de alterar alguns parâmetros de
visualização, utilizando o botão do direito do rato, incluindo o ângulo e posição de
visualização e a possibilidade de efectuar zooms.
5.4.4 arquitectura do sistema
o software do lightpack tem conceptualmente dois níveis de abstracção. ao mais alto
nível encontra-se o lifauth e as bibliotecas dos light fields que fornecem um conjunto
de operações que podem ser ministradas nos light fields. ao nível mais baixo tem-se
as bibliotecas de gestão de light fields, que lidam com a gestão destes ficheiros. o
capítulo 5: aplicação didáctica de light fields 62
ficheiro central chama as outras funções, iniciando-se com o comando lfbegin. as
rotinas de dados iniciam o processo de construção de uma lista de operações que o
programa deseja efectuar até ser executado o comando lfend.
o objectivo de optimização é também desejado, portanto o lifauth funciona a dois
passos: primeiro selecciona um conjunto de dados de treino e gera um vq codebook -
vector quantization codebook (conjunto pequeno de quadrículas que pode ser utilizado
para aproximar todas as quadrículas do light field). em seguida, lê os dados em
formato rgb (extensão “.rgb”), comprime com o codebook e escreve no ficheiro “.lif”.
apesar de a maior parte dos computadores não ter espaço de memória central suficiente
para conter todos os dados “.rgb”, é utilizada a teoria do dataflow, assegurando-se que
uma parte do light field, é comprimida e guardada antes de avançar para a parte
seguinte.
as bibliotecas libgeom e libvq providenciam funções que são utilizadas pela liblight. a
biblioteca geom fornece algumas das funções de geometria utilizadas para a projecção e
clipping dos planos uv e st, enquanto que as bibliotecas de vq lidam com a compressão
“vector quantization”.
5.4.5 formato do ficheiro light field
o ficheiro “.lif” (light field) é um único ficheiro que utiliza um formato próprio de
descrição de light fields. é composto por duas partes: um cabeçalho e uma secção de
dados binários. o cabeçalho contém informação sobre o número de “slabs” (que são
unidades do light field, parametrizados pelos planos uv e st), a geometria espacial e
informação como cada slab é guardado. a segunda secção consiste nos diversos
segmentos (usualmente cada slab tem um) e outro tipo de dados, como por exemplo,
vq codebooks para a compressão. assim sendo, o cabeçalho consiste em linhas de
texto ascii e pode ser de tamanho variável. a primeira linha deverá conter o formato e
versão “lif1.0” e a última linha do cabeçalho deverá conter a palavra-chave
“endheader”.
os comentários aparecem marcados com o símbolo “#”, como se pode analisar no
exemplo que está contido na figura 27:
capítulo 5: aplicação didáctica de light fields 63
figura 27: exemplo de um cabeçalho do formato “.lif”.
no cabeçalho é também introduzido o valor corrente do tamanho do segmento e a
definição do segmento inicia-se com a linha: “bgnlightfield 1”. de seguida, contém
informação que é aplicada a todo o light field. a primeira linha deverá ser o número de
slabs. por exemplo: “slabs 4 #view from south, west, north, east.”. após esta
informação, o cabeçalho contem uma descrição de cada segmento de dados.
cada segmento de dados pode conter um ou mais canais, ou seja, blocos contínuos de
armazenamento. uma descrição do segmento contém outra informação específica a
cada tipo de segmento, nomeadamente, um segmento slab conterá a dimensão e
geometria do slab; um segmento codebook vq conterá o número de tiles (pequenos
hiper cubos de pixels) e a dimensão dos mesmos. um tile comum terá a dimensão
2x2x2x2, o que significa que inclui um total de 16 pixels.
em compressão vq o light field é dividido em tiles e o codebook consiste numa lista
de tiles. um exemplo de um segmento slab está patente na figura 28:
figura 28: exemplo de um segmento slab.
capítulo 5: aplicação didáctica de light fields 64
5.4.6 rendering (volvis e volpack)
um conceito modular é utilizado para a síntese de imagem. diferentes tipos de
sintetizadores de imagem foram definidos na estrutura lf_renderertype, incluindo
volpack, volvis, e renderman (a descrever adiante). todos os métodos de rendering
utilizam a estrutura de dados (lfrenderer) que lhes indica as especificações sobre a
qualidade, os argumentos e o tempo de entrada. o ficheiro a sintetizar é especificado
por uma simples string a qual todos os renderers interpretam como o nome do ficheiro
de dados. um número variável de argumentos pode ser escolhido de um vector de
parâmetros disponíveis numa ordem configurável, uma vez que a ordem dos parâmetros
deverá ser independente da ordem na qual o renderer espera os seus argumentos. os
dados são armazenados num ficheiro com a extensão “.lid” que descreve a geometria
do light field, indicando o tipo de rendering, passo, posição e o nível de qualidade. o
renderer diz à aplicação que níveis de qualidade são suportáveis através da colocação
de um campo na estrutura dos dados de renderer.
cada método de rendering fornece funções lf*alloc(), lf*render(), lf*done() e
lf*renderparams() que contêm os recursos de alocação e síntese de imagem para cada
método. rendering é chamado com matrizes de modelo e projecção, bem como
especificações das transformações de vista. de modo a simplificar a implementação, a
estrutura global lfview contém uma representação diferente que especifica a posição
do observador e foco, campo de visão, tamanho e método de transferir imagens para o
plano de imagem, bem como as rotações redundantes do objecto. este é o modelo de
vista utilizado pela aplicação lifview original. lf*renderparams() é utilizado para
fornecer um visualizador com a habilidade para apresentar uma interpretação visual dos
parâmetros e/ou dos dados a serem vistos.
os métodos principais de rendering disponíveis e suas principais potencialidades, são
os seguintes:
• volpack. a utilização de volpack é limitada apesar das suas possibilidades. a
string de configuração é utilizada com o nome de um ficheiro com extensão
“.den” que fornece os dados em “bruto”. por isso toda a informação adicional
como cor de mapeamento e iluminação são determinados pelo programa na
altura de compilação e não com a configuração do renderer.
capítulo 5: aplicação didáctica de light fields 65
• volvis. este método é mais versátil. lê os ficheiros do ambiente criados pela
aplicação volvis e utiliza todos os objectos, a cor de mapeamento, os métodos
de projecção, tais como especificados no ficheiro. a qualidade mapeia
directamente os diferentes ajustes de qualidade do volvis, com uma excepção:
qualidade 0 que implica utilizar o anteriormente referido volpack.
• renderman. as ferramentas de blue moon rendering são chamadas para criar o
rendering de um ficheiro rib. este ficheiro é composto por um cabeçalho que
especifica as transformações de vistas correntes calculadas em renderman e o
ficheiro de configuração. este ficheiro contém só a descrição do mundo sendo a
imagem sintetizada escrita num directório temporário e carregada outra vez. por
isso a velocidade de rendering é limitada e, para cenas complexas, não será
possível atingir taxas de refrescamento que permitam visualização interactiva.
os renderers são utilizados com dois objectivos: durante a criação de um light field a
função lfreadslicefile() começa por procurar um ficheiro “.rgb” ou “.tiff” para a
posição corrente no plano uv. se não for possível encontrá-lo, chama renderuv(), que
calcula a posição da câmara de acordo com os parâmetros correntes uv. outra utilização
é a síntese dos dados originais quando nenhum light field é carregado ou gerado, ou é
induzido através do ajuste dos parâmetros no contexto no lfview. então os métodos de
desenho chamam o renderer, em vez de iterar em cima dos slabs no light field. a cada
actualização da janela no lifview é chamada esta função e a sintetização pode ser lenta.
esta função agora simplesmente retorna a imagem posterior se nenhum parâmetro foi
alterado entretanto.
5.5 aplicação didáctica de visualização
a aplicação didáctica de visualização de light fields permite ao utilizador explorar
funcionalidades de interacção alterando parâmetros e podendo optar pelo modo de
visualização. a seguir são descritas estas opções, bem como o tipo de plataforma e as
potencialidades requeridas ao sistema.
capítulo 5: aplicação didáctica de light fields 66
5.5.1 plataforma de desenvolvimento seleccionada
a aplicação didáctica de visualização foi desenvolvida para ambiente windows xp
[windowsxp, 2007] e o seu acesso é efectuado a partir de um ficheiro executável.
ficheiros separados contêm light fields distintos que podem ser visualizados com o
auxílio da aplicação. a linguagem de programação em que foi desenvolvida a aplicação
foi o c/c++ [kernighan, 1978], [stroustrup, 1994], utilizando o ambiente de
desenvolvimento visual studio developer [visual studio, 2007], com recurso à api
gráfica opengl.
a escolha do sistema operativo windows xp como ambiente de desenvolvimento teve
como justificação, essencialmente, o cariz didáctico desejado para a aplicação final. o
sistema operativo windows é sem dúvidas o mais utilizado globalmente a nível mundial
e em particular em portugal. deste modo, o potencial de utilização didáctica da
aplicação desenvolvida é maximizado, permitindo inclusivamente a fácil realização do
inquérito pretendido.
a utilização do opengl (open graphics library) deveu-se ao facto de ser uma
especificação de uma api multiplataforma e multi-linguagem. deste modo a sua
utilização pode ser efectuada em sistemas windows, mas também, por exemplo, em
sistemas linux. o open gl permite o desenvolvimento de aplicações gráficas 3d e
contém mais de duas centenas de funções distintas que podem ser utilizadas para
desenhar cenas tridimensionais complexas, sendo deste modo ideal para o
desenvolvimento de aplicações de visualização de light fields.
a utilização da linguagem c/c++ e o consequente ambiente de desenvolvimento visual
developer studio da microsoft, deveu-se essencialmente à disponibilidade do software
base de mark levoy [levoy, 1996] e versão subsequente de patrick ohly [ohly, 2004],
construídos ambos em linguagem c. acrescem a este facto motivações específicas
relativas à adequação da linguagem c/c++ ao desenvolvimento de aplicações
interactivas, gráficas de visualização 3d, sobretudo quando associada à biblioteca
opengl. as potencialidades do c/c++ adequadas à realização deste trabalho incluem:
• ser uma linguagem com um núcleo extremamente simples, possuindo as
funcionalidades não-essenciais, tais como funções matemáticas ou gestão de
ficheiros, fornecidas por um conjunto de bibliotecas standard;
• possibilidade de acesso de baixo-nível à memória do computador, através da
utilização de apontadores (essencial na maioria das aplicações de computação
gráfica);
• disponibilização de estruturas de dados apropriadas, incluindo a possibilidade
de programação orientada a objectos utilizando classes, objectos e métodos;
capítulo 5: aplicação didáctica de light fields 67
• enorme eficiência da linguagem quando comparada com linguagens rivais
(essencial em aplicações de computação gráfica e visualização tridimensional);
• portabilidade dos programas desenvolvidos em c ou c++;
• não exigências de overhead para facilidades que não são utilizadas;
• a linguagem pode ser utilizada mesmo sem um ambiente de desenvolvimento
sofisticado;
• facilidade de utilização da biblioteca opengl em conjunto com a linguagem
c++.
o ambiente de desenvolvimento seleccionado permitiu, deste modo, construir a
aplicação simples de visualização didáctica de light fields pretendida.
5.5.2 potencialidades requeridas ao sistema
o sistema de visualização de light fields desenvolvido procurou conter uma série de
funcionalidades genéricas de visualização de imagens, bem como algumas
funcionalidades específicas de apresentação de componentes tridimensionais. as
potencialidades genéricas que idealmente o sistema de visualização interactiva de light
fields deve possuir são basicamente as seguintes:
visualização de light fields criados através da captação de imagens de modo
sequencial, utilizando câmaras apropriadas ou realizando a captura através de
cenas virtuais;
visualização de light fields criados com parâmetros distintos;
apresentação através de um visualizador gráfico em ambiente windows, num
computador pessoal, dos light fields criados;
potencialidades de variação interactiva dos parâmetros de visualização dos light
fields;
possibilidade de execução de operações típicas de visualização de objectos
tridimensionais tais como rotações, zooms e translações;
inclusão de operações de visualização “didácticas” de light fields,
direccionadas, exclusivamente para permitir uma melhor compreensão do
conceito ao utilizador da aplicação.
o software foi construído utilizando como base o trabalho de marc levoy [levoy,
1996] que já continha potencialidades básicas de leitura e visualização de light fields
por linha de comando em ambiente linux ou sgi.
capítulo 5: aplicação didáctica de light fields 68
5.5.3 interface gráfica da aplicação
a interface gráfica da aplicação é intuitiva e simples de compreender as diversas
categorias disponíveis. na figura 29 é apresentado o esquema da interface gráfica da
aplicação. como é visível, a aplicação pretende ser muito simples, contendo uma barra
de título, uma barra de menus que disponibiliza todos os comandos e uma área de
visualização de lfs. todas as operações são também disponibilizadas através do
teclado permitindo, deste modo, uma interactividade acrescida com o utilizador.
figura 29: esquema da interface gráfica da aplicação de visualização de light
fields.
na figura 30 estão presentes três imagens representativas da interface gráfica da
aplicação em distintas situações.
figura 30: interface do programa de visualização de light fields.
a aplicação de visualização está estruturada com menus que possibilitam as seguintes
opções:
definição do ficheiro a visualizar;
menu de opções
área de visualização dos lfs
título da aplicação
capítulo 5: aplicação didáctica de light fields 69
definição do tipo de zoom;
método de interpolação a utilizar;
tipo de refinamento a utilizar;
opção de reinicialização da visualização;
rotação do light field em qualquer direcção
translação do light field.
a aplicação possui menus que possibilitam a selecção das operações disponibilizadas.
estas operações podem também ser seleccionadas utilizando o teclado.
figura 31: visualização de uma rotação de 360º de um light field.
capítulo 5: aplicação didáctica de light fields 70
na figura 31, é visível a rotação de 360º de um light field, sendo possível a
visualização da transição entre pares de planos.
5.6 sítio web didáctico
o sítio web didáctico completa a aplicação didáctica sendo a base de esclarecimento, a
porta de entrada e guia para o desenvolvimento do conhecimento da técnica light
fields. os objectivos a atingir e o modo como foi desenhado e concebido são descritos
a seguir.
5.6.1 plataforma de desenvolvimento seleccionada
a plataforma utilizada para a construção do sítio web foi o windows xp [windowsxp,
2007] e o ambiente de desenvolvimento para as páginas web, foi o macromedia
dreamweaver mx 2004 [dreamweaver, 2007]. a escolha do windows deveu-se aos
motivos já apontados com ênfase na sua muito grande divulgação. a escolha do
dreamweaver deveu-se essencialmente à facilidade de utilização e simplicidade da
execução do programa em ambiente windows.
o macromedia dreamweaver é uma ferramenta de desenvolvimento para a web criada
pela macromedia6
. versões iniciais da aplicação serviam como simples sistemas de
edição html. no entanto, versões mais recentes incorporaram suporte para muitas
outras tecnologias web tais como xhtml, css, javascript, entre outros [w3schools,
2007]. desde o final dos anos 90, o dreamweaver tem acumulado um sucesso crescente
e possui actualmente cerca de 3/4 do mercado de editores html. existem versões para
diversas plataformas tais como o mac os, embora a sua utilização seja mais
generalizada no ambiente de desenvolvimento seleccionado para este trabalho: o
windows xp.
as razões da escolha do dreamweaver para este trabalho foram essencialmente:
• facilidade de utilização e simplicidade da execução do programa;
• editor de código e editor visual integrados numa interface única que pode ser
personalizada;
• previsão (preview) dos sítios web, tal como seriam visualizados na maioria dos
navegadores web;
6
agora adobe systems após a sua aquisição em 2005.
capítulo 5: aplicação didáctica de light fields 71
• vasto conjunto de ferramentas de gestão de sítios tais como a capacidade de
pesquisa e substituição, no sítio completo, de linhas de texto ou de código,
através de parâmetros especificados;
• possibilidade de criação de javascript básico, sem quaisquer conhecimentos de
programação;
• ferramentas de criação de conteúdo dinâmico;
• possibilidade de utilização de molduras (“frames”) de modo muito simples;
• capacidade de copiar parcelas de documentos do microsoft word e excel
preservando tipos de letra, cores e estilos;
• arquitectura expansível com possibilidade de criação/utilização de pequenos
programas “extensões” que podem ser criados e utilizados por qualquer
desenvolvedor;
• disponibilidade de uma elevada quantidade de modelos, estilos e layouts;
• existência de uma ampla comunidade de utilizadores.
acresce a este conjunto de motivações uma razão essencial de selecção do
dreamweaver que consistiu na sua muito fácil utilização por criadores com pouca
experiência na linguagem de programação.
5.6.2 potencialidades requeridas ao sistema
o sítio web desenvolvido pretende ser uma ferramenta didáctica sobre a técnica light
fields e, por isso, procurou conter uma série de funcionalidades típicas de sítios web
didácticos, adaptadas ao tema em estudo. as potencialidades requeridas ao sítio web
foram basicamente as seguintes:
interface gráfica simples e apelativa;
boa usabilidade para utilizadores com bons conhecimentos de informática;
disponibilização de conceitos base organizados sobre os diversos temas mas
também actividades extra e apontadores para material auxiliar/complementar;
descrição dos conceitos base necessários à compreensão do conceito de light
field, isto é, os conceitos de luz, iluminação e radiância;
explicação da plenoptic function e da sua complexidade e apresentação do
conceito e métodos básicos de image based rendering;
explicação do conceito de light field e das suas possíveis representações e
parametrizações;
capítulo 5: aplicação didáctica de light fields 72
apresentação dos mais recentes desenvolvimentos na área da aquisição e
visualização de light fields;
disponibilização de actividades multimédia associadas aos diferentes conceitos;
disponibilização de apontadores adequados que permitam ao utilizador
aprofundar os seus conhecimentos sobre os conceitos abordados.
deste modo, o sistema de aprendizagem desenvolvido pretende permitir a um utilizador
com bons conhecimentos de informática ao nível de informática a aquisição agradável e
muito rápida de conhecimentos básicos sobre light fields.
5.6.3 interface gráfica da sítio web
o sítio web foi desenhado para conter sessões com conceitos e apontadores para dar a
conhecer a base teórica e o desenvolvimento da técnica de light fields. assim sendo,
são dez as sessões que constituem as páginas do sítio web:
conceito de luz;
iluminação;
radiância;
image based rendering;
plenoptic function;
representações e o processo de rendering;
light fields;
definição e representação do light field;
programa de visualização;
mais desenvolvimentos.
na figura 32 encontra-se representado o esquema do sítio web desenvolvido. na
moldura de topo foi introduzido um índice com acesso às dez sessões e, dentro destas,
são apresentadas diversas actividades complementares e apontadores para consulta mais
aprofundada e variada dos conceitos. é também apresentada a possibilidade de consulta
da aplicação de visualização e um contacto para dúvidas.
capítulo 5: aplicação didáctica de light fields 73
figura 32: esquema do sítio web sobre light fields.
quando se efectua uma consulta a outros locais na internet são mantidas as molduras de
topo e lateral ficando sempre disponível o índice, de modo a possibilitar ao utilizador o
regresso ao local de origem; ou seja, as páginas de outros sítios web são visualizadas
dentro da página do sítio web: aplicação didáctica de light fields.
na sessão sobre o programa de visualização está disponibilizada a aplicação de
visualização que numa fase posterior, na realização do inquérito apresentado no capítulo
seguinte, será também analisada pelos utilizadores. esta aplicação poderia ser
descarregada e executada em ambiente windows e encontrando-se disponível em todas
as páginas. é de salientar que a última sessão pretendeu ser uma porta aberta para a
compreensão dos novos avanços em light fields que estão presentemente a ser
investigados e para as aplicações dos mesmos.
o interface gráfico é simples, prático e de fácil compreensão, já que a estrutura é linear
e com um menu descritivo das sessões disponíveis. contém hipertexto, imagens e
vídeos que enriquecem o sítio web. as potencialidades incluídas no sítio web e
aplicação referentes à visualização e interactividade permitem desenvolver a atenção e
motivação perante os novos conceitos. como foi abordado na secção 5.1.2, sobre
visualização e interactividade, ao utilizar este tipo de aplicação o aluno compreenderá e
sentir-se-á mais motivado para a compreensão dos novos conceitos.
título do sítio web
corpo do sítio web
actividades
apontadores
aplicação
contacto
menu de opções/índice
capítulo 5: aplicação didáctica de light fields 74
figura 33: imagem da sessão sobre mais desenvolvimentos na área de light fields.
na figura 33 encontra-se representada uma imagem do sítio web desenvolvido, sendo
visíveis as diferentes secções do sítio e a interface gráfica que, como se pode observar,
seguiu linhas simples de fácil compreensão e entendimento. é de realçar o cuidado e
organização na elaboração das páginas do sítio web, sendo que para cada tema há uma
página diferente. o recurso a imagens, vídeos e actividades foram escolhidos atendendo
ao tema e com o objectivo de transmitir mais facilmente os conceitos abordados.
5.7 sumário do capítulo
nesta secção da dissertação foi apresentado o desenvolvimento efectuado da aplicação
didáctica de light fields composta por uma aplicação de visualização e um sítio web. a
aplicação de visualização foi desenvolvida em ambiente windows, utilizando a
linguagem c++ e a biblioteca opengl.
a aplicação didáctica de light fields vem por um lado transformar a abordagem a este
assunto, facilitando a compreensão da concepção do lf através da sua visualização
interactiva e da disponibilização de conteúdos multimédia de suporte à aprendizagem,
adequados. por outro lado, a sua disponibilização em sistema operativo windows
permite que o seu potencial didáctico seja muito mais alargado. deste modo foi possível
a realização de um estudo exploratório a utilizadores com bons conhecimentos de
informática de modo a averiguar as potencialidades da aplicação desenvolvida, no
processo de ensino/aprendizagem do conceito de light field.
índice/menu de
opções
apontadores de
pesquisa
adicional
corpo do sítio
web com os
conceitos
capítulo 6
6. estudo exploratório
a motivação para aprender é um fenómeno complexo e um tema intimamente ligado à
psicologia e educação. a motivação pode ser encarada como um processo e não como
um produto [pintrich, 2002], embora seja possível estudá-la pelos comportamentos que
ele produz. a motivação envolve objectivos que requerem esforço, persistência,
planeamento, tomada de decisões e resolução de problemas. exige também o
conhecimento de como cada um responde às dificuldades e fracassos encontrados.
este capítulo pretende responder à questão sobre a importância da utilização prática da
aplicação didáctica de light fields desenvolvida para a compreensão da teoria
subjacente aos conceitos e analisar a necessidade da mesma, para que a motivação
perante este método se mantenha elevada.
em termos de objectivos pretendidos do estudo, estes consistem em avaliar a influência
do sítio web e da utilização da aplicação de visualização de lf em utilizadores com e
sem conhecimentos em computação gráfica.
6.1 metodologia e objectivos
a metodologia praticada seguiu as etapas gerais da investigação baseada em inquérito
[hill et al., 2005], começando pela definição dos objectivos do inquérito, construindo o
planeamento e desenho geral do mesmo.
a investigação realizada foi baseada num estudo:
observacional: uma vez que não há, à partida, o conhecimento e controlo sobre
o tipo de indivíduos que responde e analisa as variáveis;
analítico: já que pretende estudar a relação entre as variáveis e colocar à prova
uma hipótese de investigação;
capítulo 6: estudo exploratório 76
transversal: porque se analisam as respostas num dado momento do tempo,
sem haver preocupação de por quanto tempo manterão estas características,
nem de como foram adquiridas, sendo que a interpretação dos dados obtidos foi
avaliada posteriormente com testes estatísticos.
recorrer a este tipo de investigação é comum no âmbito do conhecimento ao nível
educacional [tuckman, 2002] e permite obter dados úteis para a melhor condução do
processo educativo até atingir objectivos pré-determinados.
a evolução da visualização de dados e de informação tem-se mostrado uma área
científica cada vez mais profunda, uma vez que a investigação começa a estabelecer
fundamentos e teorias nesta área. a avaliação é sobretudo qualitativa, o que motiva a
minimização de erros, sendo possível estabelecer métricas que traduzam a precisão e a
tendência no sentido de melhorar a eficácia e eficiência. portanto, o conhecimento dos
processos de percepção visual é mais um caso de análise. todavia, este conhecimento
depende do utilizador que tem de ser incluído no estudo e, ao sê-lo, a sua opinião deve
ser avaliada e avalizada.
assim sendo, advém, deste facto, a importância da resposta perante as hipóteses de
utilização da aplicação para a obtenção do melhor conhecimento teórico dos light
fields.
perante estes objectivos gerais e realizado o estudo dos fundamentos e métodos
similares foi delineado um questionário que obedeceu à seguinte estrutura:
a introdução do questionário incluiu um pedido de cooperação para o
preenchimento, indicando uma estimativa do tempo necessário, a razão da
aplicação do questionário e a natureza académica da investigação.
o primeiro bloco de questões refere-se à caracterização sócio-profissional do
inquirido: sexo, idade, habilitações literárias e profissão.
o segundo bloco diz respeito ao nível de conhecimento sobre computação
gráfica e utilização de aplicações de visualização de imagens.
o terceiro bloco refere-se, na continuação do anterior, aos conhecimentos
prévios sobre os conceitos que são explicados no sítio web.
o quarto bloco refere-se aos conhecimentos adquiridos após a análise teórica por
consulta do sítio web.
o quinto bloco envolve a aplicação de visualização da técnica de image based
rendering e refere-se ao modo como o utilizador percepciona as cenas com
diferentes parâmetros.
capítulo 6: estudo exploratório 77
o sexto bloco refere-se aos conhecimentos adquiridos após manuseamento da
aplicação de visualização de light fields.
quanto ao tipo de questões introduzidas procurou-se que fossem concisas, de fácil
compreensão e na maior parte delas as respostas eram fechadas, isto é, com as
diferentes possibilidades já definidas, o que trouxe vantagens evidentes para a análise
estatística posterior. o questionário também inclui questões de resposta aberta, para
complementar e confirmar a informação fornecida pelos inquiridos, possui as indicações
e passos que o utilizador deveria seguir para o preencher. nessas indicações foi
introduzido o apontador do sítio que disponibilizava as sessões com os conceitos sobre
luz, iluminação, radiância, image based rendering, plenoptic function, rendering e
light fields. na figura 34 encontra-se uma representação do aspecto geral do
questionário elaborado. no anexo 1, pode ser encontrado o questionário completo.
figura 34: aspecto geral do questionário elaborado.
é de salientar que, num primeiro momento, tal como é aconselhado na literatura da
especialidade [hill et al., 2005] foi realizado um estudo preliminar aplicando uma
versão prévia do questionário final. o objectivo consistiu em seleccionar as perguntas
adequadas para serem incluídas na versão final.
a experiência efectuada foi presencial, com um grupo de voluntários nas instalações da
faculdade de engenharia da universidade do porto (feup), para compreender as
reacções dos inquiridos ao questionário, ao sítio web e à aplicação, assim como verificar
se surgiriam dúvidas quanto aos passos a dar para responderem às perguntas. assim
capítulo 6: estudo exploratório 78
sendo, foram introduzidas algumas alterações ao questionário ao nível de
encaminhamento e algumas questões reformuladas ou mesmo eliminadas, uma vez que
a sua relevância para o estudo era diminuta. de um modo geral, os inquiridos desta fase
entenderam o que lhes estava a ser proposto, responderam ao questionário, colocaram
dúvidas e deram opiniões perante o que estava a ser analisado.
figura 35: interface do site da aplicação didáctica de light fields.
na recolha de dados, o método utilizado foi a divulgação através da internet, uma vez
que um dos objectivos iniciais seria abordar indivíduos com bons conhecimentos de
informática. posteriormente, foi realizado um estudo dos dados para se obter a análise
descritiva e inferência dos mesmos utilizando a ferramenta spss 15.0 (statistical
package for the social sciences) para windows [spss, 2007]. assim sendo, foram
definidas as variáveis e introduzidos os dados. os tipos de escalas para as variáveis
apresentadas foram:
nominais: este tipo de escala consiste num conjunto de categorias de resposta
qualitativamente diferentes e mutuamente exclusivas, como por exemplo, sexo
e profissão.
ordinais: este tipo de escala admite uma ordenação numérica das suas
categorias, ou seja, das respostas alternativas, estabelecendo uma relação de
ordem entre elas, como por exemplo as variáveis que mediram o nível de
conhecimento.
de rácio: este tipo de escala tem a característica da escala ordinal, em que o
valor numérico mais elevado na escala indica uma quantidade maior da variável
capítulo 6: estudo exploratório 79
medida. outra característica adicional indica que as diferenças entre valores
numéricos adjacentes na escala permanecem iguais na quantidade da variável
medida e o valor “zero” não é arbitrário, como por exemplo, a variável idade.
6.2 população e amostra
nesta secção é apresentado o tipo de utilizadores que fizeram parte do estudo estatístico
e que contribuíram para a avaliação e balanço da utilização da aplicação didáctica sobre
a técnica de light fields.
a população deste estudo foi constituída por utilizadores com bons conhecimentos em
informática. a amostra recolhida envolveu 102 indivíduos que estudam ou trabalham
em território português, sendo que a amostra pode ser classificada como não-
probabilística, uma vez que quem participou no inquérito tinha de ser utilizador de
computador e ter acesso à internet, e de conveniência, já que os indivíduos se
encontravam acessíveis ao investigador.
idade
frequência abso-
luta
frequência rela-
tiva
18 4 3,9
19 5 4,9
20 2 2,0
21 1 1,0
22 3 2,9
23 3 2,9
24 9 8,8
25 9 8,8
26 8 7,8
27 9 8,8
29 2 2,0
30 6 5,9
31 6 5,9
32 2 2,0
33 5 4,9
34 1 1,0
35 7 6,9
36 6 5,9
37 3 2,9
38 3 2,9
39 1 1,0
40 4 3,9
41 1 1,0
45 2 2,0
total 102 100,0
tabela 1: frequência da idade dos indivíduos da amostra.
capítulo 6: estudo exploratório 80
como se pode analisar na tabela 1, a amostra é caracterizada por ser jovem, uma vez
que as idades estão compreendidas entre os 18 e os 45 anos. a variável idade é
trimodal, sendo que os valores que têm maior frequência absoluta são os 24, 25 e 27
anos.
relativamente ao nível de escolaridade e pela análise da figura 36 conclui-se que a
maior percentagem de inquiridos possui o grau de licenciatura, com uma percentagem
de 31%. é de realçar que o nível de habilitações literárias se encontra entre o 12º ano e
ensino superior e que o mais alto grau académico, ou seja, doutoramento correspondia
uma percentagem de 25%.
habilitações literárias da amostra
24%
1%
31%
19%
25%
até ao 12º
bacharelato
licenciatura
mestrado
doutoramento
figura 36: gráfico das percentagens das habilitações literárias da amostra.
a amostra é constituída por 89% de indivíduos do sexo masculino e 11% do sexo
feminino. esta diferença é típica na comunidade informática onde os indivíduos do sexo
masculino são normalmente maioritários.
sexo dos inquiridos
11%
89%
feminino
masculino
figura 37: gráfico das percentagens do sexo dos inquiridos.
capítulo 6: estudo exploratório 81
relativamente ao tipo de utilizador, pode ser observado na tabela 2 que, no total de 102
inquiridos, se encontra a maior frequência no nível “bastante” em relação à experiência
com programas de visualização de imagens e “alguma” experiência em modelação
gráfica num total de 22 inquiridos. por outro lado, em relação à frequência mais baixa,
zero casos, são várias as possibilidades, tais como: ter “pouca” experiência em
modelação gráfica e “nenhuma” experiência com programas de visualização de
imagens; ter “muita” experiência em modelação gráfica e “bastante” experiência com
programas de visualização de imagens ou também ter “bastante” experiência em
modelação gráfica e ter “muita” experiência com programas de visualização.
experiência com programas de visualização de imagens
nenhuma pouca alguma bastante muita total
nenhuma 5 9 7 3 0 24
pouca 0 5 14 13 0 32
alguma 0 0 9 22 4 35
bastante 0 0 0 4 0 4
experiência em
modelação
gráfica
muita 0 0 0 0 7 7
total 5 14 30 42 11 102
tabela 2: tipo de conhecimentos em computação gráfica vs experiência com
programas de visualização de imagens.
foram também analisadas as respostas em relação ao tipo de inquirido relativamente
aos conhecimentos em computação gráfica. na tabela 3, verifica-se a frequência
absoluta nos dois casos: existindo 61 inquiridos com conhecimentos e 41 sem
conhecimentos.
frequência
absoluta
frequência
relativa
com conhecimentos 61 59,8
sem conhecimentos 41 40,2
total 102 100,0
tabela 3: nível de conhecimentos em computação gráfica.
os conhecimentos que possuíam à partida sobre os conceitos mais específicos tais como
image based rendering (ibr) e light field (lf) foram também recolhidos. as tabelas
4 e 5 correspondem às frequências absolutas relativas ao tipo de resposta. note-se que
foram colocadas questões de resposta aberta para verificar se, de facto, os inquiridos
manifestavam esses conhecimentos.
capítulo 6: estudo exploratório 82
frequência
absoluta
frequência
relativa
frequência rela-
tiva acumulada
nenhum 37 36,3 36,3
pouco 52 51,0 87,3
algum 4 3,9 91,2
bastante 9 8,8 100,0
muito 0 0,0 100,0
total 102 100,0
tabela 4: nível de conhecimento do conceito de ibr.
frequência
absoluta
frequência
relativa
frequência rela-
tiva acumulada
nenhum 62 60,8 60,8
pouco 31 30,4 91,2
algum 2 2,0 93,1
bastante 7 6,9 100,0
muito 0 0,0 100,0
total 102 100,0
tabela 5: nível de conhecimento do conceito de light field.
assim sendo, e pela análise das tabelas 4 e 5, verifica-se que 87,3% dos inquiridos
referiu ter poucos ou nenhuns conhecimentos de image based rendering e que 91,2%
dos inquiridos referiu que tinha poucos ou nenhuns conhecimentos sobre o conceito de
light field, apesar de a maior parte ter conhecimentos em computação gráfica. a
percentagem que respondeu ter “bastantes” conhecimentos de ibr e lfs foi
respectivamente 8,8% e 6,9% o que revela o pouco conhecimento nesta matéria.
destaca-se ainda que ninguém respondeu possuir “muitos” conhecimentos em nenhuma
destas matérias.
concluída a análise dos dados iniciais e o nível de conhecimentos da amostra em
estudo, foram levantadas as hipóteses relativas ao modo de evolução dos conhecimentos
adquiridos pelos indivíduos, com posterior acesso ao sítio web e aplicação da
ferramenta de visualização de light fields.
para compreender melhor o tipo de investigação efectuada por questionário é essencial
abordar alguns aspectos teóricos sobre os procedimentos a tomar e em que se baseiam.
6.3 procedimentos
a análise estatística pode ser efectuada a partir da descrição dos resultados dos dados,
como foi apresentada no subcapítulo anterior, para caracterizar a amostra em estudo ou
capítulo 6: estudo exploratório 83
pode, alternativamente, ser baseada numa análise inferencial. neste último caso podem
utilizar-se duas abordagens:
estimação de parâmetros: usando a informação de uma estatística amostral
podem tirar-se conclusões sobre o valor de um parâmetro da população os quais
são apresentados com intervalos de confiança.
testes de hipóteses: usando a informação sobre um parâmetro da população é
possível decidir se uma hipótese (pressuposto) sobre um parâmetro da
população deve ou não ser rejeitada.
a selecção da estatística inferencial é orientada para a pergunta que precisa de ser
respondida. dentro da abordagem dos testes de hipóteses, e, de modo que a
probabilidade de cometer um erro tipo i (rejeitar a hipótese sendo ela verdadeira) seja
facilmente calculada, deve-se formular a hipótese tendo em vista assumir exactamente o
oposto do que queremos provar. ou seja, se se pretende verificar que o sítio web
influencia o nível de conhecimento dos inquiridos, o pressuposto a admitir será que não
há diferenças em relação ao nível de conhecimento antes e após consulta ao sítio web.
assim se compreende o significado de hipótese nula, quando esta contém a afirmação
de não haver diferenças. a hipótese alternativa discorda da hipótese nula e, se a
hipótese nula é rejeitada em resultado da evidência, a hipótese alternativa é a conclusão.
por outro lado, se não houver evidência suficiente para rejeitar a hipótese nula, ela
mantém-se, mas não é aceite, apenas se podendo afirmar que não se pode rejeitar.
o tipo de teste a utilizar depende dos factores iniciais do problema e também deve ser
escolhido o nível de significância antes de utilizar o teste estatístico. este valor é
designado por valor α e indica a probabilidade de rejeitar a hipótese nula quando é, de
facto, verdadeira. esta probabilidade deverá ser pequena, porque não se deve cometer o
erro tipo i, sendo α igual a 0,05 o valor tradicional.
um outro conceito importante ligado à significância estatística é o valor p. o valor p
(p_value) está relacionado com o teste de hipótese, correspondendo à probabilidade de
obter um resultado mais extremo do que o observado, se a hipótese nula é verdadeira.
se o valor estiver próximo de zero, é um indicador de que a hipótese nula é falsa,
enquanto que se estiver próximo de um, não há evidência suficiente para a rejeitar. o
valor p é calculado depois de realizado o teste estatístico e, se for menor do que α,
rejeita-se a hipótese nula. para a determinação do valor p foi utilizada a ferramenta
spss, que permite incorporar este valor no output dos resultados dos testes estatísticos
que realiza.
resumindo, o procedimento que se pode observar no esquema da figura 38, para a
realização do teste de hipóteses apresentado neste trabalho é o seguinte:
enunciar a hipótese nula e a alternativa;
capítulo 6: estudo exploratório 84
fixar o limite para o nível de significância α e identificar a distribuição da
estatística;
escolher o teste estatístico a efectuar, perante as condições da amostra e
variáveis em estudo;
observar o valor p e comparar com o nível de significância α;
retirar as conclusões e esclarecer as evidências estatísticas no contexto das
hipóteses.
figura 38: diagrama esquemático do processo dos testes de hipóteses.
alguns dos pontos mais importantes na aplicação de um teste de hipóteses
correspondem a reconhecer a situação experimental em função das variáveis envolvidas,
a escala em que estão medidas as variáveis e caracterizar o tipo de experiência: amostras
constituídas por medições feitas repetidamente nas mesmas unidades experimentais ou
em unidades experimentais distintas.
para realizar testes e inferências em que os parâmetros são proporções (percentagens ou
probabilidades) e não médias, o teste a aplicar será baseado em contagens e são
adequados para variáveis numa escala nominal ou ordinal. neste trabalho surgiram dois
tipos distintos de situações:
comparação de proporções em duas amostras independentes (utilizadores com e
sem conhecimento em computação gráfica), utilizando a distribuição qui-
quadrado;
comparação de proporções em duas amostras emparelhadas (nível de
conhecimento antes e após consulta do sítio web e antes e após a experiência
com a aplicação de visualização dos lfs), baseado na distribuição qui-
quadrado.
enunciar as hipóteses
nível de significância (α)
escolher o teste estatístico
comparar o valor p com o
nível de significância α
conclusões
capítulo 6: estudo exploratório 85
figura 39: diagrama esquemático da escolha dos testes de hipóteses.
na figura 39 estão representadas esquematicamente as possibilidades de aplicação de
testes de hipóteses na análise inferencial. o caminho utilizado para atingir o tipo de
testes utilizado para responder às questões, e dependendo das condições iniciais, está
salientado a cor mais clara. assim sendo, dado que os métodos utilizados se baseiam em
contagens, que não é conhecida a média da população e porque as variáveis a estudar
são ordinais, resulta que os parâmetros a estimar são proporções e não médias. dentro
deste campo encontram-se, portanto, os testes que convêm: comparação de proporções
em amostras independentes (utilizadores com e sem conhecimentos em computação
gráfica) e comparação de proporções em amostras emparelhadas (nível de
conhecimento antes e após facultar o sítio web e, posteriormente, a aplicação de
visualização de lfs). os testes mcnemar e marginal homogeneity [reis, 2001] regem-
análise inferencial
intervalos de confiança
(…)
testes de hipóteses
distribuição normal?sim não
desvio padrão (σ)
da população
conhecido?
parâmetros a estimar
médias proporções
sim não
teste z teste t
amostras
emparelhadas?
sim não
teste t para
amostras
emparelhadas
variância
igual?
teste fsim não
teste t com
σ1=σ2
teste t com
σ1≠σ2
teste não
paramétrico
comparação em
duas amostras
independentes
(qui-quadrado)
comparação em
duas amostras
emparelhadas
(mcnemar e
marginal
homogeneity)
qualidade
de ajuste
capítulo 6: estudo exploratório 86
se pelo mesmo princípio, contudo enquanto o mcnemar é um teste para variáveis
dicotómicas, o marginal homogeneity serve para variáveis multinomiais.
as hipóteses em estudo são, numa primeira fase, verificar se há evidências estatísticas
para afirmar que os conhecimentos são diferentes antes e após a consulta ao sítio web e
que os conhecimentos dos inquiridos são diferentes antes e após o acesso à ferramenta
de visualização de light fields. desta forma e exemplificando para o conceito de ibr,
a primeira hipótese nula é: não há diferenças nas respostas sobre o conhecimento do
conceito de image based rendering antes e após a consulta ao sítio web, enquanto que
a hipótese alternativa é: há diferenças sobre o nível de conhecimento do conceito de
image based rendering após a consulta ao sítio web. para os outros conceitos é
aplicado o mesmo teste sendo análogo o processo.
para testar as hipóteses e sabendo que o tipo de variável em estudo é ordinal foi
aplicado o teste de hipóteses de comparação de proporções em amostras emparelhadas
(marginal homogeneity). sabendo que o p_value neste caso é 0,00 e é menor do que α,
há evidências estatísticas para afirmar, com um nível de significância de 5%, que há
diferenças no nível de conhecimento sobre ibr antes e após a análise do sítio web
em seguida, analisaram-se as respostas perante a análise dos conceitos luz, iluminação,
radiância, plenoptic function, light field e entendimento dos planos uv e st.
um outro tipo de análise efectuada corresponde ao teste de hipóteses sobre o nível de
conhecimento destes conceitos antes e após a utilização da aplicação de visualização de
light fields. o teste aplicado também é sobre comparação de proporções em duas
amostras emparelhadas.
para perceber como diferia o nível de conhecimento entre os inquiridos com e sem
conhecimentos em computação gráfica foi aplicado o teste de comparação de
proporções de amostras independentes, uma vez que há a possível separação em dois
grupos distintos. foi interessante observar e analisar a variação no nível de
conhecimento destes dois grupos, numa primeira fase após a consulta ao sítio web e,
numa segunda fase, após a experiência com o programa de visualização de lfs.
a variável tempo também foi contabilizada sendo que a média de análise e
preenchimento do questionário é importante salientar.
no subcapítulo seguinte estão descritos os resultados obtidos decorrentes destas
experiências.
capítulo 6: estudo exploratório 87
6.4 resultados obtidos
a primeira experiência foi relativa à utilização do sítio web para consulta dos conceitos
apresentados, como luz, iluminação, radiância, image based rendering, plenoptic
function, light field e entendimento dos planos uv e st.
conceito
hipóteses
hip. nula | hip. alter.
p_value
evidências estatísticas
(nível de signficância de 0,05)
luz 0,000
há evidências estatísticas para afirmar que a
distribuição das variáveis sobre o nível de
conhecimento do conceito luz é diferente
antes e após a consulta do sítio..
iluminação 0,000
há evidências estatísticas para afirmar que a
distribuição das variáveis sobre o nível de
conhecimento do conceito iluminação é
diferente antes e após a consulta do sítio.
radiância 0,000
há evidências estatísticas para afirmar que a
distribuição das variáveis sobre o nível de
conhecimento do conceito radiância é
diferente antes e após a consulta do sítio..
image
based
rendering
0,000
há evidências estatísticas para afirmar que a
distribuição das variáveis sobre o nível de
conhecimento do conceito ibr é diferente
antes e após a consulta do sítio..
plenoptic
function
0,000
há evidências estatísticas para afirmar que a
distribuição das variáveis sobre o nível de
conhecimento do conceito plenoptic
function é diferente antes e após a consulta
do sítio..
light field
0,000
há evidências estatísticas para afirmar que a
distribuição das variáveis sobre o nível de
conhecimento do conceito lf é diferente
antes e após a consulta do sítio..
planos uv e
st
não há
diferenças
quanto ao
nível de
conhecimento
do conceito
antes e após a
consulta do
sítio web.
há diferenças
quanto ao
nível de
conhecimento
do conceito
antes e após a
a consulta do
sítio web.
0,000
há evidências estatísticas para afirmar que a
distribuição das variáveis sobre o nível de
entendimento dos planos uv e st é diferente
antes e após a consulta do sítio..
tabela 6: evidências estatísicas quanto às diferenças do nível de conhecimento após
análise do sítio web.
em relação aos dados obtidos, pode, através do quadro resumo apresentado na tabela 6,
inferir-se que há evidências estatísticas, a um nível de significância de 0,05, para
afirmar que há diferenças quanto ao nível de conhecimentos sobre os conceitos
apresentados antes e após consulta do sítio web.
como seria de esperar e se pode observar, há evidências estatísticas para afirmar que a
um nível de significância de 5%, a distribuição das variáveis sobre o nível de
entendimento dos conceitos apresentados é diferente antes e após a consulta do sítio
web. este resultado seria de esperar mas destacam-se os valores obtidos para os
capítulo 6: estudo exploratório 88
p_values, aproximadamente nulos, mostrando sem margem para dúvidas a existência
de evidências estatísticas para afirmar que a distribuição das variáveis sobre os níveis de
conhecimento dos diferentes conceitos é diferente antes e após a consulta do sítio web.
as tabelas 7 e 8 permitem empiricamente confirmar que houve um maior número de
respostas que passou a ter um nível de compreensão “bastante” e muito”, com uma
percentagem de 75,5% (= 50%+25,5%), enquanto que anteriormente estes dois níveis
tinham uma percentagem de resposta de 39,2%, ou seja um aumento de 36,3%. nota-se,
contudo, que ainda houve uma percentagem de 4,9% de respostas que afirma ter
“nenhum” entendimento sobre o conceito de luz após análise do sítio web.
frequência
absoluta
frequência
relativa
frequência rela-
tiva acumulada
nenhum 9 8,8 8,8
pouco 9 8,8 17,6
algum 44 43,1 60,8
bastante 36 35,3 96,1
muito 4 3,9 100,0
total 102 100,0
tabela 7: frequência absoluta e relativa do nível de compreensão do conceito de luz
antes da análise do sítio web.
frequência
absoluta
frequência
relativa
frequência rela-
tiva acumulada
nenhum 5 4,9 4,9
algum 20 19,6 24,5
bastante 51 50,0 74,5
muito 26 25,5 100,0
total 102 100,0
tabela 8: frequência absoluta e relativa do nível de compreensão do conceito de luz
após análise do sítio web.
as tabelas 9 e 10 referem-se às frequências para o nível de compreensão do conceito de
light field antes e após consulta do sítio web.
frequência
absoluta
frequência
relativa
frequência rela-
tiva acumulada
nenhum 84 82,4 82,4
pouco 9 8,8 91,2
algum 7 6,9 98,0
bastante 2 2,0 100,0
muito 0 0 100,0
total 102 100,0
tabela 9: frequência absoluta e relativa do nível de compreensão do conceito de light
field.
capítulo 6: estudo exploratório 89
frequência
absoluta
frequência
relativa
frequência rela-
tiva acumulada
nenhum 13 12,7 12,7
pouco 40 39,2 52,0
algum 34 33,3 85,3
bastante 14 13,7 99,0
muito 1 1,0 100,0
total 102 100,0
tabela 10: frequência absoluta e relativa do nível de compreensão do conceito de
light field após análise do sítio web.
é de salientar que para a maior parte dos indivíduos (82,4%), o conceito de light field
era completamente desconhecido. pelo mesmo princípio é justificado o aumento das
frequências nas respostas de “alguma” e “bastante” compreensão do conceito de lf.
os outros conceitos também sofreram este tipo de mudanças.
a segunda experiência foi relativa à análise do nível de conhecimento dos conceitos
após a utilização do programa de visualização de lfs. assim sendo, foram analisadas as
evidências estatísticas relativamente ao nível de conhecimentos antes e após a
experiência com o programa de visualização de lfs, considerando a mesma amostra
com 102 elementos. na tabela 11 estão apresentados os resultados obtidos para o
p_value e a respectiva interpretação.
através da tabela 11 é possível verificar que não há evidências estatísticas para afirmar
que o entendimento sobre os conceitos de luz, iluminação, radiância, image based
rendering e plenoptic function sejam diferentes antes e após a experiência com a
aplicação de visualização de lfs. porém, relativamente ao conceito de lfs e
entendimento sobre os planos uv e st, há evidências estatísticas, a um nível de
significância de 5%, para afirmar que as distribuições são diferentes antes e após a
utilização da aplicação de visualização de lfs.
para uma completa avaliação é ainda importante obter resultados relativamente ao nível
de entendimento dos conceitos antes e após utilização da aplicação de visualização de
lfs, mas tendo em vista o tipo de indivíduo que já possuía conhecimentos em
computação gráfica e aquele que não os tinha. assim, foi aplicado o teste de
comparação de proporções de amostras independentes, a um nível de significância de
5%. da aplicação deste teste conclui-se que há evidências estatísticas para afirmar que a
distribuição da variável entendimento de light fields não é idêntica nos grupos de
indivíduos com e sem conhecimentos em computação gráfica, já que o valor p obtido,
que foi de 0,001, é claramente inferior ao nível de significância fixado.
capítulo 6: estudo exploratório 90
conceito
hipóteses
hip. nula | hip. alter.
p_value
evidências estatísticas
(nível de signficância de 0,05)
luz 1,000
não há evidências estatísticas para afirmar
que, a distribuição das variáveis sobre o
nível de conhecimento do conceito luz é
diferente antes e após a utilização da
aplicação de visualização de lf’s.
iluminação 0,796
não há evidências estatísticas para afirmar
que a distribuição das variáveis sobre o
nível de conhecimento do conceito
iluminação é diferente antes e após a
utilização da aplicação de visualização de
lf’s.
radiância 0,297
não há evidências estatísticas para afirmar
que a distribuição das variáveis sobre o
nível de conhecimento do conceito
radiância é diferente antes e após a
utilização da aplicação de visualização de
lf’s.
image
based
rendering
0,433
não há evidências estatísticas para afirmar
que a distribuição das variáveis sobre o
nível de conhecimento do conceito ibr é
diferente antes e após a utilização da
aplicação de visualização de lf’s.
plenoptic
function
0,134
não há evidências estatísticas para afirmar
que a distribuição das variáveis sobre o
nível de conhecimento do conceito
plenoptic function é diferente antes e
após a utilização da aplicação de
visualização de lf’s.
light field 0,000
há evidências estatísticas para afirmar que
a distribuição das variáveis sobre o nível
de conhecimento do conceito light field
é diferente antes e após a utilização da
aplicação de visualização de lf’s.
planos uv e
st
não há
diferenças
quanto ao
nível de
conhecimento
do conceito
antes e após a
utilização e
experiência
com a
aplicação de
visualização
de lf’s.
há diferenças
quanto ao nível
de
conhecimento
do conceito
antes e após a
utilização e
experiência com
a aplicação de
visualização de
lf’s.
0,000
há evidências estatísticas para afirmar que
a distribuição das variáveis sobre o nível
de entendimento do funcionamento dos
planos uv e st é diferente antes e após a
utilização da aplicação de visualização de
lf’s.
tabela 11: evidências estatísicas quanto às diferenças do nível de conhecimento
experiência com o programa de visualização de lfs.
nas tabelas 12 e 13 podem encontrar-se os dados que confirmam a afirmação anterior.
capítulo 6: estudo exploratório 91
conceito
hipóteses
hip. nula | hip. alter.
p_value
evidências estatísticas
(nível de signficância de 0,05)
image
based
rendering
0,134
não há evidências estatísticas para afirmar que
a distribuição das variáveis sobre o nível de
conhecimento do conceito ibr é diferente
antes e após a utilização da aplicação de
visualização de lf’s.
plenoptic
function
0,655
não há evidências estatísticas para afirmar que
a distribuição das variáveis sobre o nível de
conhecimento do conceito plenoptic function
é diferente antes e após a utilização da
aplicação de visualização de lf’s.
light field 0,131
não há evidências estatísticas para afirmar que
a distribuição das variáveis sobre o nível de
conhecimento do conceito lf’s é diferente
antes e após a utilização da aplicação de
visualização de lf’s.
planos uv e
st
não há
diferenças
quanto ao
nível de
conhecimento
do conceito
antes e após a
utilização e
experiência
com a
aplicação de
visualização
de lf’s
há diferenças
quanto ao
nível de
conheciment
o do conceito
antes e após a
utilização e
experiência
com a
aplicação de
visualização
de lf’s.
1,000
não há evidências estatísticas para afirmar que
a distribuição das variáveis sobre o nível de
entendimento dos planos uv e st é diferente
antes e após a utilização da aplicação de
visualização de lf’s.
tabela 12: evidências estatísticas quanto às diferenças do nível de conhecimento após
experiência com o programa de visualização de lfs em indivíduos sem conhecimento
em cg.
conceito
hipóteses
hip. nula | hip. alter.
p_value
evidências estatísticas
(nível de signficância de 0,05)
image
based
rendering
0,527
não há evidências estatísticas para afirmar
que a distribuição das variáveis sobre o nível
de conhecimento do conceito ibr é diferente
antes e após a utilização da aplicação de
visualização de lf’s.
plenoptic
function
0,035
há evidências estatísticas para afirmar que a
distribuição das variáveis sobre o nível de
conhecimento do conceito plenoptic
function é diferente antes e após a utilização
da aplicação de visualização de lf’s.
light field 0,000
há evidências estatísticas para afirmar que a
distribuição das variáveis sobre o nível de
conhecimento do conceito lf’s é diferente
antes e após a utilização da aplicação de
visualização de lf’s.
planos uv e
st
não há
diferenças
quanto ao
nível de
conhecimento
do conceito
antes e após a
utilização e
experiência
com a
aplicação de
visualização
de lf’s
há diferenças
quanto ao
nível de
conheciment
o do conceito
antes e após a
utilização e
experiência
com a
aplicação de
visualização
de lf’s.
0,000
há evidências estatísticas para afirmar que a
distribuição das variáveis sobre o nível de
entendimento dos planos uv e st é diferente
antes e após a utilização da aplicação de
visualização de lf’s.
tabela 13: evidências estatísicas quanto às diferenças do nível de conhecimento após
experiência com o programa de visualização de lfs em indivíduos com conhecimento
em cg.
capítulo 6: estudo exploratório 92
é interessante observar que, quando se faz a distinção entre o tipo de utilizador, com ou
sem conhecimentos em computação gráfica, os tipos de conclusões a retirar são
diferentes. para aqueles que têm conhecimentos em computação gráfica, há evidências
estatísticas para afirmar que a um nível de significância de 5%, a distribuição de
variáveis sobre o nível de conhecimento é diferente antes e após a experiência com a
aplicação de visualização de lfs, o mesmo não ocorrendo quando o utilizador não tem
conhecimentos em computação gráfica.
a seguir serão apresentadas a discussão e a análise dos resultados obtidos para melhor
entender as razões e consequências deste estudo.
6.5 discussão e análise dos resultados
neste trabalho foram estudadas as repercussões que a aplicação didáctica de lfs pode
ter nos utilizadores de computador, principalmente as diferenças do nível de
conhecimento adquirido, perante conceitos complexos e novos de computação gráfica,
pelos utilizadores com uma base sólida de conhecimentos nesta área e utilizadores que
apesar de não terem conhecimentos específicos têm vasta experiência em informática e
trabalham com computadores diariamente.
os resultados obtidos esclarecem que o nível de conhecimento de todos os conceitos
aumentou, como seria de esperar, após a consulta ao sítio web, uma vez que os
conceitos estão explicados teoricamente. esta componente teórica serviu de apoio base
para a introdução da componente prática, através da aplicação de visualização de lfs.
é de realçar que neste estudo, há alguns constrangimentos e limitações a focar,
nomeadamente o facto de não ter sido efectuada a experiência para analisar o tipo de
resposta dos utilizadores perante o facto de estarem confrontados simplesmente com a
aplicação antes do acesso aos conceitos teóricos. contudo, neste trabalho era importante
que os inquiridos tivessem contacto, mesmo sendo ligeiro, de algum conhecimento na
área. outra limitação é o facto da amostra ter sido por conveniência, uma vez que todos
os utilizadores têm acesso diário às ferramentas do pc, ficando de fora outras possíveis
análises sobre o modo como outros grupos de indivíduos responderiam a este tipo de
conhecimento.
outra consideração trata-se do tempo que o grupo esteve perante os conceitos, não
sendo suficiente para fazer consultas pormenorizadas aos apontadores de apoio. em
média para a consulta ao sítio web, a experiência com a aplicação de visualização de
lfs e o preenchimento do questionário foi dispendido um período de uma hora, que
manifestamente não é suficiente para a análise de todos os apontadores disponíveis.
capítulo 6: estudo exploratório 93
conclui-se também que, e como seria de esperar, existem evidências estatísticas de que
o nível de conhecimento é significativamente diferente após consulta e análise do sítio
web; contudo, só se verificam essas diferenças após a experiência com a aplicação de
visualização de light fields, quando o grupo de indivíduos tem conhecimentos na área
da computação gráfica.
capítulo 7
7. conclusões e perspectivas de
desenvolvimento
neste trabalho foi apresentado um estudo da técnica light fields e da sua
fundamentação teórica. foram apresentados conceitos sobre a luz e iluminação e
deduzida a equação da radiância, concluindo-se que esta não tem solução analítica geral.
deste modo foram analisados diversos pressupostos para a sua simplificação e as
soluções apresentadas por investigadores da área. com base neste estudo foram
apresentados os métodos principais de image based rendering baseados nas diversas
técnicas de simplificação propostas.
a técnica dos light fields utiliza, como dados de entrada, múltiplas vistas de uma cena
e consiste em armazenar e processar a luz que é irradiada da cena. o processo consiste
em capturar a luz que chega da cena. a condição de luz de uma cena pode ser
caracterizada através da dimensão 5 da plenoptic function que descreve o fluxo de luz
(radiância) em cada ponto no espaço de dimensão 3 em qualquer direcção (2 graus de
liberdade). no entanto, assumindo um objecto limitado e um espaço livre, a radiância
não muda ao longo de uma linha de vista, reduzindo o espaço de dimensão 5 a um
espaço de dimensão 4. este tipo de técnica envolve diversos aspectos matemáticos e
físicos que apresentam alguma dificuldade de compreensão.
de modo a permitir uma melhor compreensão do conceito de light fields foi projectada
e implementada uma aplicação didáctica composta por uma aplicação de visualização
em ambiente windows de lfs e um sítio web. a aplicação desenvolvida foi utilizada
no ensino rápido do conceito a indivíduos com bons conhecimentos de informática e
distintos conhecimentos na área da computação gráfica.
o inquérito realizado no âmbito deste trabalho permitiu concluir que, num espaço de
tempo muito reduzido, utilizadores com bons conhecimentos em informática,
incrementaram significativamente os seus conhecimentos relativos a todos os conceitos
relacionados com a técnica dos light fields. foi concluído com um nível de
capítulo 7: conclusões e perspectivas de desenvolvimento 96
significância de 0.05 que os utilizadores, após uma breve análise do sítio web,
aumentaram os seus conhecimentos relativamente a todos os (sete) conceitos
apresentados. foi também concluído que os utilizadores aumentaram posteriormente os
seus conhecimentos relativamente ao conceito de light field e ao funcionamento dos
planos uv e st após a utilização da aplicação de visualização.
uma conclusão interessante decorrente da investigação realizada neste trabalho é que,
apesar de terem sido fornecidos conceitos teóricos a indivíduos com bons
conhecimentos na área da informática e de estes terem compreendido alguns conceitos,
só o grupo com significativa experiência em computação gráfica é que viu o seu nível
de conhecimento aumentar significativamente após experiência com a aplicação de
visualização de lfs. na realidade, este grupo viu os seus conhecimentos aumentarem
significativamente relativamente ao conceito de “plenoptic function”, “light field” e
“planos uv e st”, enquanto que no grupo com bons conhecimentos de informática mas
fracos conhecimentos em cg não se observou este fenómeno (pelo menos com um
nível de significância estatisticamente válido). deste modo pode-se concluir que a
aplicação desenvolvida é apropriada sobretudo a indivíduos com alguns conhecimentos
em computação gráfica, grupo aliás a que a mesma era originalmente destinada.
relativamente às perspectivas futuras de desenvolvimento deste trabalho, fica em aberto
o recurso às actividades presentes no sítio web, que poderiam ser alargadas para que os
utilizadores interligassem conceitos teóricos e práticos. embora o sítio web apresente
diversas actividades apropriadas, o desenvolvimento de actividades extra,
nomeadamente no que diz respeito aos conceitos de image based rendering e light
fields seria de extrema utilidade.
a aplicação de visualização de lfs tem características que podem ser dilatadas, de
modo a poder ser possível acrescentar componentes mais específicas e teóricas, de
forma a tornar mais fácil o acesso a todo o tipo de indivíduos. a adição de operações
didácticas extra de manipulação de light fields, por exemplo de manipulação
interactiva dos planos uv e st, poderia incrementar o potencial de utilização da
aplicação, sobretudo para utilizadores com menores conhecimentos de computação
gráfica.
o estudo estatístico também poderia ser direccionado para uma linha de investigação
mais abrangente na área da didáctica multimédia relacionada não só com tópicos
complexos na área da computação gráfica mas também em outras áreas. o
desenvolvimento de outras aplicações didácticas que permitam o ensino de conceitos
complexos, complementado por estudos estatísticos apropriados relativos à
compreensão e consolidação de conhecimentos, assume-se, neste contexto, como uma
linha de investigação futura promissora.
97
referências bibliográficas
[adelson e bergen, 1991] adelson, e. h., bergen, j. r., “the plenoptic function and
the elements of early vision”, computational models of visual processing,
cambridge, ma: mit press, 1991
[ahrenberg e magnor, 2006] ahrenberg, l., magnor, m. “light field rendering using
matrix optics”, journal of winter school of computer graphics (wscg), 14th
international conference in central europe on computer graphics, visualization and
computer vision, pp. 177-184, república checa, janeiro 2006
[apple, 2007] apple inc., “quick time vr”. disponível em: http://www.apple.com
/quicktime/ technologies/ qtvr/ [consultado em setembro de 2007]
[baumgartner e hafele, 2004] baumgartner, p., hafele, h., “content management
systeme in e-education”, auswahl, potenziale und einsatzmoglichkeiten. innsbruck-
wien, studienverlag, 2004
[bloom, 1956] bloom, b. s., “taxonomy of educational objectives: book 1, cognitive
domain”, new york, longman, 1956
[borman e stevenson, 1998] borman, s., stevenson, r. l., “super-resolution from
image sequences – a review”, midwest symposium on circuits and systems, 1998
[buehler, 2001] buehler, c., bosse, m., mcmillan, l., gortler e cohen, m.,
“unstructured lumigraph rendering”, computer graphics, special interest group on
graphics and interactive techniques (siggraph’01), pp. 425-432, agosto 2001
[camahort et al., 1999] camahort, e., fussel, d., “a geometric study of light field
representations”, technical report tr-99-35, department of computer science,
university of texas, austin, 1999
[carlson, 2007] carlson, w., “a critical history of computer graphics and
animation”. disponível em: http://design.osu.edu/carlson/history [consultado em julho
de 2007]
[chai et al., 2000] chai, j. x., tong, x., chan, s. c. e shum, h. y., “plenoptic
sampling”, computer graphics, special interest group on graphics and interactive
techniques (siggraph’00), pp. 307-318, julho 2000
[chan et al., 2003] chan, s. c., ng, k. t., gan, z. f., chan. k. l. e shum. h. y., “the
data compression of simplified dynamic light fields”, international conference on
acoustics, speech and signal processing (icassp’03), hong kong, abril 2003
[chen, 1995] chen, s. e. “quicktime vr – an image-based approach to virtual
environment navigation”, computer graphics special interest group on graphics and
interactive techniques (siggraph’95), agosto 1995
referências bibliográficas 98
[chen, 2006] chen, b., “novel methods for manipulating and combining light
fields”, standford university, 2006
[cohen et al., 1993] cohen, m., wallace, j., “radiosity and realistic image sintesis”,
academia press professional, harcourt brace et company, publishers, pp. 13-40, 1993
[dansereau, 2003] dansereau, d., “4d light field processing and its application to
computer vision”, calgary university, 2003
[dreamweaver, 2007] dreamweaver “adobe systems - dreamweaver”. disponível em:
http://www.adobe.com/products/dreamweaver/ [consultado em setembro de 2007]
[faria et al., 2007] faria, b.; costa, j.; marques, e., matos, v. “os gráficos”, faculdade
de ciências da universidade do porto, 2003
[foley et al., 1990] foley, j. van dam, a., feiner, s., hudges, j. “computer graphics:
principles and practice”, 2nd
edition, addison-wesley publishing company, 1990
[foote e kimber, 2000] foote, j. e kimber, d., “flycam: pratical panoramic video”,
international conference on multimédia&expo (icme’00), agosto 2000
[fosnot, 2000] fosnot, c. t., “construtivismo e educação – teorias, perspectivas e
práticas”, instituto piaget, novos horizontes, 2000
[gesho e gray, 1992] gesho, a., gray, r., “vector quantization and signal
compression”, kluwer academia publishers, 1992
[gilbert e boulter, 1998] gilbert, j. k., boulter, c. j., “aprendendo ciências através de
modelos e modelagem”, colinvaux, d. ed. modelos e educação em ciências, pp. 12-
34, 1998
[girod et al., 2003] girod, b., chang, c. l., ramanathan, p. e xiaoqing zhu, “light
field compression using disparity compensated lifting”, international conference on
acoustics, speech and signal processing icassp’03, hong kong, china, abril 2003
[glasersfeld, 1996] glasersfeld, e. v., “construtivismo radical”, instituto piaget,
isbn: 9728329687, 1996
[glut, 2005] glut, “glut – the opengl utility toolkit”. disponível em:
http://www.opengl.org/resources/libraries/glut/ [consultado em janeiro de 2005]
[gomes, et al., 2006] gomes, t. ferracioli, l. “a investigação da construção de
modelos no estudo de um tópico de física utilizando um ambiente de modelagem
computacional qualitativo”, revista brasileira de ensino de física, vol. 28 n. 4, são
paulo, issn: 0102-4744, 2006
[gortler et al., 1996] gortler, s. j., grzeszczuc, r., szeliski, r. e cohen, m. f., “the
lumigraph”, computer graphics (siggraph’96), pp. 43-54, agosto 1996
[gouraud, 1971] gouraud, h, “continuous shading of curved surfaces”, institute of
electrical and electronics engineers (ieee) transactions on computers, pp. 623-628,
1971
[gu et al., 1997] gu, x., gortler, s., cohen, m., “polyhedral geometry and the two-
plane parameterization”, 8th
eurographics worshop on rendering, pp.1-12, 1997
referências bibliográficas 99
[hammond, 1993] hammond, n. “learning with hypertext: problems, principles and
prospects”. disponível em: http://telecaster.lboro.ac.uk/happ/chapter4.html
[consultado em janeiro de 2003]
[hill et al., 2005] hill, m. m., hill, a., “investigação por questionário”, edições
sílabo, lda, 2ª edição, lisboa, 2005
[ihm et al., 1997] ihm, park, s., lee, r. k., “rendering of spherical light fields”,
proceedings pacific graphics’97, 1997
[issing, 1994] issing, l. j. “from instructional technology and multimedia didactics”,
educational media international, vol. 31, no 3, pp. 171-182, 1994
[issing, 2003] issing, l. j. “conceitos básicos da didáctica para multimedia”.
disponível em: http://penta.ufrgs.br/edu/teleduc/tdidmult.htm [consultado em janeiro
de 2003]
[jank e meyer, 1994] jank w. e meyer h., “didaktische modelle”, cornelsen scriptor,
berlim, 1994
[jensen, 1996] jensen, h.w., “global ilumination using photon maps”, in proceedings
of the seventh eurographics workshop on rendering, springer, ny, pp. 21-30, 1996
[jonasson, 1991] jonasson, “instrutional design and learning theory”. disponível em:
http://www.usask.ca/education/coursework/802papers/mergel/brenda.htm [consultado
em outubro de 2007]
[kang e shum, 2000] kang, s.s., shum, h.y., “a review of image based rendering
techniques”, institute of electrical and electronics engineers, inc, ieee/spie visual
communications and image processing (vcip) 2000, pp. 2-13, junho 2000
[kawasaki et al., 2001] kawasaki, h., ikeuchi, k., sakauchi, m., “light field
rendering for large-scale scenes”, ieee computer society conference on computer
vision and pattern recognition, volume 2, pp. 64-76, 2001
[kernighan, 1978] kernighan, b. w., plauger, “the elements of programming style” 2ª
edição, mcgraw hill, new york, 1978
[kernighan e ritchie, 1978] kernighan b. e ritchie d., “the c programming
language”, englewood cliffs, n.j., prentice hall, 1978
[klafki, 1974] klafki, w, “curriculum – didaktik”, wulf, pp. 117-128, 1974
[kozma, 1991] kozma, r., “learning with media. review of educational research”, 61
(2), pp. 179-211, 1991
[lalonde e fournier, 1999] lalonde, p., fournier, a., “interactive rendering of wavelet
projected light fields”, graphics interface 1999, kingston, ontario, canada, pp.107-
114, setembro 1999
[lensch, 1999] lensch, h., heidrich, w., cohen, m. f., seidel, h.-p., “light field
techniques for reflections and refractions”, in eurographics rendering workshop,
junho 1999
referências bibliográficas 100
[leung e chen, 2002] leung, w. h. e chen, t., “line-space representation and
compression for image-based rendering”, carnegie mellon university, technical
report: amp01-02, 2002
[levoy, 1996] levoy, m., “lightpack: light field authoring and rendering package”.
disponível em: http://graphics.stanford.edu/software/lightpack/lightpack.html
[consultado em setembro de 2003]
[levoy e hanrahan, 1996] levoy, m. e hanrahan, p.; “light field rendering”,
computer graphics (siggraph’96), pp. 31-42; agosto 1996
[liang et al., 2007] liang, c.k., liu, g.e chen, h. h., “light field acquisition using
programmable aperture camera”, ieee international conference on image processing,
charleston, abril 2007
[lin e shum, 2000] lin, z. c. e shum, h. y., “on the number of samples needed in
light field rendering with constant-deph assumption”, computer vision and pattern
recognition (cvpr’00), hilton head island, south carolina, usa, junho 2000
[luo et al., 2000] luo, l., wu, y., li, j.e zhang, y., “compression of concentric
mosaic scenery with aligment and 3d wavelet transform”, spie: image and video
communications and processing 2000, san jose ca, pp. 89-100, january 2000
[magnor et al., 2000a] magnor, m. e girod, b., “data compression for light field
rendering”, ieee transactions on control system test vehicle (cstv), vol.10, no.3,
abril 2000
[magnor et al., 2000b] magnor, m. e girod, b., “model-based coding of multi-
viewpoint imagery”, visual communications and image processing (vcip’00), perth,
australia, junho 2000
[mager, 2005] mager, r., “preparing instructional objectives – a critical tool in the
development of effective instrution”, 3ª edição, 2005
[mcmillan e bishop, 1995] mcmillan, l.; bishop, g.; “plenoptic modeling: an image-
based rendering system”, computer graphics special interest group on graphics and
interactive techniques (siggraph’05), pp 39-46, agosto 1995
[miller et al., 1998] miller g., rubin s.e ponceleon d., “lazy decompression of
surface light fields for precomputed global illumination”, eurographics rendering
workshop 1998, viena, austria, junho 1998
[mitchell et al., 1996] mitchell, j.l., pennebaker, w. b.,fogg, c. e., legall, d. j.,
“mpeg video: compression standard”, chapman & hall, 1996
[nayar, 1997] nayar, s., “catadioptric omnidirectional camera”, computer vision and
pattern recognition (cvpr’97), porto rico, pp. 482-488, junho 1997
[ng 2001] ng, t., chan, s. c., shum, h.y., “scalable coding and progressive
transmission of concentric mosaic using nonlinear filter banks”, international
conference on image processing (icip’01), thessaloniki, outubro 2001
[ng, 2006] ng, r., “digital light field photography”, standford university, 2006
referências bibliográficas 101
[ohly, 2004] ohly, p., “extended light fields”. disponível em:
http://www.estamos.de/projects/lightfieds/ [consultado em janeiro 2004]
[ohm, 1994] ohm, j. r., “three-dimensional subband coding with motion
compensation”, ieee transactions on image processing, vol. 3, no. 5, pp. 559-571,
setembro 1994
[opengl, 2005] opengl, “the industry’s foundation for high performance
graphics”. disponível em: http://www.opengl.org/ [consultado em janeiro de 2005]
[peleg, 1997] peleg s., herman j., “panoramic mosaics by manifold projection”,
computer vision and pattern recognition (cvpr’97), washington, pp. 338-343, junho
1997
[peleg, 2000] peleg s., rousso b., rav-acha a., zomet a., “mosaicing on adaptive
manifolds”, ieee transactions on pattern analysis and machine intelligence (pami),
vol. 22 no. 10, pp. 1144-1154, outubro 2000
[peter e straber, 1999] peter i., e straber w., “the wavelet stream - progressive
transmission of compressed light field data”, ieee visualization, san francisco,
ca., 1999
[pintrich, 2002] pintrich, p.r., “the role of goal orientation – motivation in
education: theory, research and applications”, 2ª edição, englewood cliffs, nj:
prentice hall, pp. 190-242, 2002
[ramanathan, 2005] ramanathan, p., “compression and interactive streaming of light
fields”, standford university, 2005
[reigeluth, 1991] reigeluth, c. m., “reflections on the implications of constructivism
for educational technology”, educational technology, vol. 31, nº 9, pp. 34-37, 1991
[reigeluth, 1992] reigeluth, c. m., “the imperative of systematic change”,
educational technology, vol. 32, nº 11, pp. 9-13, 1992
[reis, 2001] reis, e.; mondrian, p., “estatística multivariada aplicada”, 2ª edição
revista e aumentada, edições sílabo, isbn: 972 618-247-6, lisboa, 2001
[sgi, 2005] silicon graphics, “sgi-innovation for results”. disponível em:
http://www.sgi.com/ [consultado em janeiro de 2005]
[shum e he, 1999] shum, h.y, he, l. w., “rendering with concentric mosaics”,
computer graphics special interest group on graphics and interactive techniques
(siggraph’99), agosto 1999
[shirley et al., 1995] shirley, p.; wade, b., hubbard, p. m., zareski, d., walter, b.,
greenberg, d. p., “global illumination via density-estimation”, in proceedings of the
6th
eurographics workshop on rendering”, edited by hanrahan and purgathofer,
springer-verlag, pp. 219-230, june 1995
[shum et al., 2000] shum h. y., ng k.t.e chan s. c., “virtual reality using the
concentric mosaic: construction, rendering and data compression”, international
conference on image processing (icip’00), vancouver, canada, setembro 2000
referências bibliográficas 102
[shum et al., 2001] shum h. y., li j.e zhang y., “on the compression of the image
based rendering scene: a comparison among block, reference and wavelet coders”,
internacional journal on image and graphics, vol. 1, no. 1, pp. 45-61, 2000
[shum et al., 2001b] shum, h. y., ng, k.t., chan, s. c.e kang, s. b., “on the data
compression and transmission aspects of panoramic video”, international conference
on image processing (icip’01), thessaloniki, grécia, outubro 2001
[shum, 2002] shum h. y., wang l. f., chai j. x. e tong x., “rendering with
manifold hopping”, international journal of computer vision, pp. 644-647, novembro
2002
[slater, 2000] slater, m. “tutorial on light field rendering”, seoul, korea, pp.35-53,
outubro 2000
[sloan, 1997] sloan, p., “time critical lumigraph rendering”, in proceedings of the
1997 symposium on interactive 3d graphics, acm, rhode island, usa, pp. 17-29,
1997
[spss, 2007] spss inc., “spss, data mining, statistical analysis software, predictive
analysis”. disponível em: http://www.spss.com/ [consultado em setembro de 2007]
[stroustrup, 1994] stroustrup b., “the design and evolution of c++”, addison-
wesley, isbn 0-201-54330-3, 1994
[szeliski, 1994] szeliski, r., “image mosaicing for tele-reality applications”,
technical report crl94/2, dec cambridge research lab, maio 1994
[szeliski e shum, 1997] szeliski, r., shum, h. y., “creating full view panoramic
image mosaic and texture mapped models”, computer graphics special interest
group on graphics and interactive techniques (siggraph’97), pp. 251-258, agosto
1997
[taubman e zakhor, 1994] taubman d. e zakhor a., “multirate 3-d subband coding
of video”, ieee transactions on image processing, vol. 3, no. 5, pp. 572-588,
setembro 1994
[taubman e marcellin, 2001] taubman d. e marcellin m., “jpeg2000: image
compression fundamentals, standards e practice”, kluwer academic publisher,
novembro 2001
[tennyson e nielsen, 1998] tennyson, r. d. e nielsen, m., “complexity theory:
inclusion of the affective domain in an interactive learning model for instructional
design”, educational technology, vol. 38, nº 6, pp. 7-12, 1998
[tham et al., 1998] tham j. y., ranganath s., e kassim a. a., “highly scalable
wavelet-based video codec for very low bit-rate environment”, ieee journal on
selected areas in communications, vol. 16, nº 1, janeiro 1998
[tuckman, 2002] tuckman, b. w., “manual de investigação em educação: como
conceber e realizar o processo de investigação em educação”, lisboa: fundação
calouste gulbenkian, 2002
[visual studio, 2007] visual studio, “visual studio developer center”. disponível em:
http://msdn2.microsoft.com/pt-br/vstudio/ [consultado em setembro de 2007]
referências bibliográficas 103
[watson, 1913] watson, j. b., “psychology as the behaviorist views it”, psychological
review, nº20, pp. 158-177, 1913
[wilburn et al., 2002] wilburn, b., smulski, m., lee, h. k. e horowitz, m., “the light
field video camara”, proceedings of media processors 2002, society of photographic
instrumentation engineers (spie) electronic imaging 2002
[windowsxp, 2007] windowsxp, “microsoft windows xp home edition”. disponível
em: http://www.microsoft.com/ windowsxp/home/ [consultado em setembro de 2007]
[wood et al., 1997] wood, d. n., finkelstein, a., hudges, j. f., thayer, c. e. e salesin,
d. h., “multiperspective panoramas for cell animation”, computer graphics
(siggraph’97), pp. 243-250, agosto 1997
[wood et al., 2000] wood, d., azuma, d., aldinger, k., curless, b., duchamp, t.,
salesin, h., “surface light fields for 3d photography”, computer graphics
(siggraph’2000), acm press, addison wesley longman, edited by kurt akeley,
pp. 287-296, julho 2000
[whitted, 1980] whitted, t. “an improved illumination model for shaded display”, in
communications of the acm, vol. 23, pp. 343-349, 1980
[w3schools, 2007] w3schools, “w3shools – the best things in life are free”.
disponível em: http://www.w3schools.com/xhtml/xhtml_summary.asp [consultado em
setembro de 2007]
[yang et al., 2002] yang, j. c., everett, m., buehler, c. e mcmillan, l., “a real-time
distributed light field camera”, eurographics workshop on rendering, 2002
[zhang e li, 2000] zhang, c.e li, j., “compression and rendering of concentric
mosaics with reference block codec (rbc)”, visual communications and image
processing (vcip’00), perth, australia, junho 2000
[zhang e chen, 2003] zhang, c., chen, t.; “spectral analysis for sampling image-
based rendering data”, ieee transactions on control system test vehicle (csvt),
special issue on image-based modeling, rendering and animation, 2003
anexo 1- questionário sobre light fields
questionário
--1/4--
light fields
o objectivo deste inquérito é recolher informação sobre a percepção e aprendizagem do utilizador
enquanto observador de cenas tridimensionais com diferentes parâmetros associados.
a informação que irá fornecer contribuirá para que seja possível retirar conclusões no estudo para a
tese “light fields: aplicação didáctica de criação de novas vistas a partir de múltiplas
imagens”, no âmbito do mestrado em tecnologia multimédia da feup.
instruções de preenchimento:
-para responder às questões fechadas clique sobre o quadrado da opção pretendida.
-para responder às questões abertas clique sobre o espaço a sombreado e escreva o texto.
-siga as instruções que encontrará no decorrer do questionário.
1. identificação do inquirido
1.1. idade
1.2. sexo m f
1.3. habilitações literárias até ao 12º ano de escolaridade
curso técnico-profissional
bacharelato
licenciatura
mestrado
doutoramento
1.4. profissão
2. utilização do computador nas aplicações gráficas
nenhum pouco algum bastante muito
2.1. conhecimentos em computação gráfica
2.2.experiência com programas de visualização
de imagens
2.3. experiência em modelação gráfica
2.4. conhecimento do conceito de imaged based
rendering
2.5. conhecimento do conceito light field (lf)
questionário
--2/4--
no final do questionário vai ser pedido o tempo que demorou a responder às questões, por isso
registe essa informação. hora de início:
3. compreensão de conceitos i
nenhum pouco algum bastante muito
3.1. compreensão do conceito de luz
3.2.compreensão do conceito de iluminação
3.3. compreensão do conceito de radiância
3.4. compreensão de image based rendering
3.5. compreensão da plenoptic function
3.6. compreensão do conceito de light field
3.7. entendimento do funcionamento dos planos
uv e st em lfs
nas afirmações do ponto 3 que respondeu ter pelo menos pouco conhecimento diga o que entende
por:
luz:
iluminação:
radiância:
image based rendering:
plenoptic function:
light fields:
funcionamento dos planos uv e st em lfs:
siga as instruções antes de responder aos próximos blocos de questões:
- analise os conceitos apresentados no sítio web http://www.fe.up.pt/~lpreis/lf/ e depois
responda às questões:
questionário
--3/4--
4. compreensão de conceitos ii
nenhum pouco algum bastante muito
4.1. compreensão do conceito de luz
4.2.compreensão do conceito de iluminação
4.3. compreensão do conceito de radiância
4.4. compreensão de image based rendering
4.5. compreensão da plenoptic function
4.6. compreensão do conceito de light field
4.7. entendimento do funcionamento dos planos
uv e st em lfs
descarregue o programa “aplicação didáctica de lf, disponível em:
http://www.fe.up.pt/~lpreis/lf/app.zip”.
experimente visualizar os três lf’s disponíveis, rodando-os e movimentando-os, utilizando os
botões do rato (esq – rotação, dir – movimentação, esq+dir – zoom).
analise, agora, os parâmetros apresentados nos menus: zoom, planos e refinamento.
no lf do leão experimente uma rotação de 360º com a opção “ver plano” activa de modo a
verificar a transição dos planos.
5. compreensão de conceitos iii
nenhum pouco algum bastante muito
5.1. compreensão do conceito de luz
5.2.compreensão do conceito de iluminação
5.3. compreensão do conceito de radiância
5.4. compreensão de image based rendering
5.5. compreensão da plenoptic function
5.6. compreensão do conceito de light field
5.7. entendimento do funcionamento dos planos
uv e st em lfs (após ver as descontinuidades na
transição dos pares de planos)
questionário
--4/4--
6. conceito de light field
nenhum pouco algum bastante muito
6.1. entendimento sobre o funcionamento do site
e da aplicação
6.2. compreensão da inserção do conceito de
light field na aplicação
6.3 interesse da técnica de lfs
responda resumidamente:
conceito de light fields:
funcionamento dos planos uv e st em lfs:
apreciação geral da técnica light field:
outros comentários ☺:
tempo que demorou a preencher o questionário:
envie o questionário preenchido para:
moni.faria@gmail.com
obrigada pela colaboração!