apesar de décadas de estudo, não compreendemos os processos fundamentais pelos quais o nosso cérebro codifica e representa a informação visual recebida e usa-a para guiar a percepção e a acção. Uma riqueza de evidências sugere que o reconhecimento visual é mediado por uma série de áreas no córtex primata conhecido como fluxo ventral, incluindo V1 (córtex visual primário), V2, E V4 (Fig. 1A) (1)., Os estágios iniciais são, em certa medida, compreendidos; Hubel e Wiesel descobriram, por exemplo, que os neurônios em V1 respondem seletivamente à orientação e direção de uma borda em movimento (2). No entanto, permanece um vasto abismo entre a codificação de uma borda simples e a representação da riqueza completa do nosso mundo visual. O próprio David Hubel observou em 2012 que ainda “quase não temos exemplos de estruturas neurais nas quais sabemos a diferença entre a informação que entra e o que sai—para que serve a estrutura., Nós temos alguma idéia da resposta para a retina, o corpo geniculado lateral, e o córtex visual primário, mas é sobre isso” (3). In PNAS, Okazawa et al. (4) fazer progressos significativos nesta busca descobrindo e caracterizando uma forma única de seletividade neural na área V4.
(a) visão Lateral do cérebro macaco com áreas ventrais precoces V1, V2 e V4 destacadas. B) diagrama esquemático dos parâmetros contidos no modelo de textura de Portilla Simoncelli. As estatísticas espectrais reflectem a saída dos filtros do tipo V1., Estatísticas de ordem superior refletem correlações dessas saídas de filtros entre orientações, frequências espaciais e posições locais. A maioria dos neurônios V1 são sensíveis apenas às estatísticas espectrais, e muitos neurônios V2 são sensíveis às estatísticas espectrais e de ordem superior; Okazawa et al. Mostre que alguns neurônios V4 estão sintonizados exclusivamente para estatísticas de ordem superior. (C-E) em áreas de fluxo ventral inicial, imagens fisicamente diferentes podem produzir respostas semelhantes, e diferentes transformações de imagem podem revelar propriedades de codificação particulares., (C) A rotação de uma imagem altera os espectros de potência, mas preserva algumas estatísticas de ordem superior. In V4, as reported by Okazawa et al., imagens de rotação diferente podem produzir respostas semelhantes. D) a tradução espacialmente de uma textura altera o pixel-por-pixel da imagem, mas preserva as estatísticas espectrais e de ordem superior. Em V2, tais imagens produzem respostas semelhantes. (E) a aleatorização da fase de uma imagem destrói as estatísticas de ordem superior, mas preserva o espectro de potência. Em V1, imagens com estatísticas espectrais semelhantes produzem respostas semelhantes, com ou sem estatísticas de ordem superior.,
um desafio central na compreensão de como os neurónios codificam estímulos visuais, sabendo que estímulo mostrar os neurónios. Nós não conhecemos os estímulos “certos” até que tenhamos alguma idéia para o que os neurônios são seletivos, mas podemos não saber para que neurônios são seletivos até que tenhamos mostrado a eles os estímulos certos. Perto do topo da hierarquia do fluxo ventral, como no córtex inferotemporal, provou-se útil para sondar respostas usando estímulos altamente complexos, tais como fotografias de cenas naturais e objetos (1, 5⇓ – 7)., No entanto, a complexidade de tais estímulos e a dificuldade em manipulá-los ou controlá-los experimentalmente podem tornar difícil dizer o que um determinado neurônio está codificando, além do fato de que ele responde mais a uma imagem do que a outra. Em fases anteriores—a retina, o corpo geniculado externo, e V1—o uso de estímulos simples, como padrões de ruído, orientada bordas, ou de onda senoidal, grades, rendeu uma razoável compreensão de trabalho de codificação neural (8), mas tais estímulos são suficientes apenas porque estes neurônios apresentam formas mais simples de codificação, pelo menos para uma primeira aproximação.,
na área estudada por Okazawa et al., área V4, a maioria dos autores anteriores caracterizaram os neurônios assumindo que eles codificam formas e contornos de gume duro, usando estímulos costurados juntos a partir de segmentos de linha “v1-like” em contornos mais longos com curvaturas parametrizadas (9⇓-11). Esta abordagem reflecte uma compreensão intuitiva do mundo visual: que as formas e superfícies são definidas pelos seus contornos envolventes e que o sistema visual deve, de alguma forma, representar estas características. No entanto, como Okazawa et al., ressalta que grande parte do mundo visual é caracterizada não por contornos, mas por Textura: os padrões que compõem as superfícies de objetos e ambientes. Ted Adelson descreveu isso como a distinção entre “coisas” (objetos, elementos de cenas) e “coisas” (materiais, texturas, etc.) (12).texturas são notoriamente difíceis de trabalhar como estímulos visuais; ao contrário do ângulo de uma linha ou da curvatura de um contorno, eles não permitem uma parametrização simples. Que Conjunto de números poderia capturar a diferença entre casca de madeira e um pedaço de grama? Para resolver este problema, Okazawa et al., baseou-se no trabalho existente na modelagem e síntese de textura visual e estendeu-o de maneiras novas. Eles começaram com um modelo de textura desenvolvido por Portilla e Simoncelli (13). O modelo tem dois componentes: um conjunto de estatísticas, computadas em uma imagem, que implicitamente capturam muitas das propriedades de ordem superior das texturas visuais (Fig. 1B), e um algoritmo para gerar estímulos com essas propriedades., Foi originalmente desenvolvido para capturar as propriedades perceptualmente relevantes da textura visual (13, 14) e tem sido estendido para explicar como as representações visuais variam em todo o campo visual (15, 16) e, qualitativamente, em diferentes áreas de fluxo ventral (6, 17).
as centenas de parâmetros contidos em tais modelos estatísticos de imagem impediram o seu uso em caracterização neural detalhada, mas Okazawa et al. são capazes de transformar o modelo em um substrato adequado para caracterizar a seletividade neural., Primeiro, eles pegaram um grande conjunto de estímulos e usaram a redução de dimensionalidade para encolher as centenas de parâmetros do modelo em um espaço de baixa dimensão. Mesmo neste espaço simplificado, eles não poderiam realisticamente mostrar todas as combinações possíveis de parâmetros para cada neurônio. Portanto, baseando-se no trabalho existente caracterizando a seletividade da forma (18), Eles usaram uma técnica de amostragem adaptativa para explorar regiões de seu espaço de baixa dimensão que evocou grandes taxas de queima., Tendo medido respostas de cada neurônio a um conjunto suficientemente rico e evocante de resposta de estímulos, eles poderiam então modelar a resposta em termos do espaço de baixa dimensão.
trabalhos anteriores examinaram as respostas dos neurônios V4 a estímulos de textura (6, 19), mas com sua técnica de modelagem, Okazawa et al. foram capazes de caracterizar em detalhe várias formas de seletividade em grande parte desconhecidas na V4. Primeiro, eles descobriram que muitos neurônios V4 foram bem descritos pela seletividade para estatísticas de imagem de ordem superior, e alguns foram sintonizados com subconjuntos particulares de estatísticas de ordem superior., Estes subconjuntos têm nomes curiosos como” orientação cruzada de energia “e” posição cruzada linear”; embora não exatamente intuitiva, os autores fazem um esforço para mostrar, com imagens, como a seletividade a uma determinada estatística se relaciona com preferências para imagens particulares., Mais notavelmente, eles usam simples manipulações de imagem para mostrar que alguns neurônios V4 codificam seletivamente essas estatísticas de ordem superior, permanecendo tolerantes a mudanças no “espectro de potência”, um termo que descreve a quantidade total de diferentes orientações e frequências espaciais em uma imagem, que é o que os neurônios V1 são principalmente sintonizados para. Por exemplo, um neurônio V4 pode responder bem a uma textura de casca, independentemente da orientação geral do padrão (Fig. 1 B E C)., Finalmente, ao examinar quão bem uma população de neurônios V4 poderia discriminar entre diferentes padrões de textura, eles foram capazes de mostrar que a representação de estatísticas de imagem de ordem superior em V4 se assemelha à representação perceptual derivada de experiências comportamentais anteriores (17).The modeling effort of Okazawa et al. representa um avanço técnico e um contrapeso conceitual aos esforços anteriores Em V4. Muitos modelos de V4 caracterizaram a seletividade para os contornos, usando espaços de recursos parametrizados simples (10, 11)., Ao invés de considerar os neurônios como executando computações em uma entrada visual real, estes modelos operam no espaço de quantidades abstratas, como curvatura, e como resultado, os modelos só se aplicam a esses tipos de estímulos. Em contraste, a abordagem atual pode fazer previsões sobre como os neurônios devem responder a qualquer padrão de estímulo (20). In future work, theOkazawa et al. foram capazes de caracterizar em detalhe várias formas de seletividade em grande parte desconhecidas na V4.os autores poderiam usar este fato para conciliar seus achados com resultados anteriores Em V4., Uma possibilidade elegante é que a selectividade previamente descrita à curvatura e contornos é apenas um caso especial de sensibilidade a estatísticas de imagem de ordem superior. No entanto, uma alternativa é Okazawa et al. focada apenas num subconjunto de células V4 especificamente sintonizadas com textura, enquanto esforços anteriores descreveram uma representação diferente, possivelmente mediada por populações neuronais distintas mas interativas.os resultados actuais também são interessantes à luz do trabalho recente na área V2., Enquanto os neurônios V1 parecem codificar quase exclusivamente propriedades espectrais como orientação e conteúdo de frequência espacial(Fig. 1 B E e), neurônios v2 adicionalmente mostram seletividade para estatísticas de imagem de ordem superior (Fig. 1 B E D), semelhantes aos parametrizados por Okazawa et al. (17). Por conseguinte, será importante determinar no futuro qual a parte da selectividade estatística de ordem superior na V4 que é herdada da V2 ou calculada de novo a partir das suas entradas., No entanto, a maioria dos neurônios V2 retêm sensibilidade às propriedades espectrais, enquanto pelo menos alguns neurônios em V4 parecem amplamente tolerantes às mudanças espectrais. Estes achados podem, portanto, sugerir uma transformação de V2 para V4 que complementa e amplia a transformação de V1 e V2. Novas técnicas serão necessárias, juntamente com o design de modelagem e estímulo, para caracterizar em detalhes mecanísticos os cálculos que ocorrem entre essas áreas corticais e entre diferentes camadas e tipos de células dentro de uma área (21)., Como exatamente essas transformações corticais formam uma base fisiológica para a visão permanece um quebra-cabeça profundamente intrigante, e abordagens como a de Okazawa et al. ajudará a preparar o caminho para a frente.