Sistemas Sensoriais/Sistema Auditivo/Processamento Timbre

Origem: Wikilivros, livros abertos por um mundo aberto.

Percepção da altura[editar | editar código-fonte]

Esta secção analisa uma questão fundamental da neurociência auditiva: percepção da altura. Assume-se um conhecimento básico sobre o sistema auditivo, nesse sentido, aconselha-se que os leitores leiam primeiro as secções acima sobre ‘Anatomia do Sistema Auditivo’ e ‘Processamento do Sinal Auditivo’.

Introdução[editar | editar código-fonte]

O Altura é uma percepção subjectiva, evocada por sons que têm uma natureza aproximadamente periódica. Para vários sons que ocorrem naturalmente, a periodicidade de um som é o principal determinante da altura. No entanto, a relação entre um estímulo acústico e a altura é bastante abstrata: em particular, a altura é bastante resistente a alterações noutros parâmetros acústicos, tais como o volume ou timbre espectral, sendo que ambos podem alterar significativamente as propriedades físicas de uma onda acústica. Isto é particularmente evidente nos casos em que sons que não partilham componentes espectrais podem evocar a mesma altura, por exemplo. Consequentemente, a informação relativa à altura tem que ser extraída de indicações espectrais e/ou temporais representadas através de vários canais de frequência.


A pesquisa sobre a codificação da altura no sistema auditivo está em grande parte focada em identificar os processos neurais que refletem estes processos de extração, ou em encontrar o ‘ponto final’ desse processo: uma representação explícita e robusta da altura como o ouvinte o percepciona. Ambas as abordagens têm tido algum sucesso, com resultados indicando a existência de ‘Neurónios sensíveis a alturas específicas’ nas consideradas ‘áreas da altura’. No entanto, ainda é discutível se a atividade destas áreas está realmente relacionada com a altura ou se elas simplesmente exibem uma representação seletiva dos parâmetros relacionados com a altura. Por um lado, a demonstração da ativação dos neurónios ou áreas neuronais específicas como resposta a vários sons semelhantes que apenas diferem na altura, mesmo que apresentem diferenças substanciais nas suas características físicas, providencia uma evidência correlativa convincente de que estas regiões estão envolvidas na codificação da altura. Por outro lado, é difícil provar com evidências causais que estes neurónios representam a altura, sendo necessário uma combinação de abordagens de gravação in vivo de forma a demonstrar uma correspondência entre estas respostas e a identificação da altura (por exemplo: respostas psicofisiológicas, e não apenas a periodicidade do estímulo), e a manipulação directa da actividade nestas células para demonstrar desequilíbrios previsíveis ou dificuldade na percepção da altura.

Devido à sua natureza abstrata, a altura constitui uma área de pesquisa ativa por resolver. Por essa razão, a discussão incidirá sobre os aspectos mais físicos da percepção da altura, isto é, a frequência de som (para tons puros) e, de forma mais geral, a periodicidade do estímulo. Especificamente, irá ser feita a distinção e definição concreta entre os conceitos de periodicidade e altura. De seguida, será feita uma descrição breve dos principais mecanismos computacionais que podem ser implementados pelo sistema auditivo para extrair informações relacionadas com a altura dos estímulos sonoros. Posteriormente, será delineado a representação e o processamento dos parâmetros da altura na cóclea, na via auditiva ascendente sub-cortical e, por fim, serão apresentadas perspectivas mais controversas em torno do córtex auditivo primário e outros, e serão avaliadas as evidências de ‘neurónios da altura' ou ‘áreas da altura' nestas regiões corticais.

Periodicidade e altura[editar | editar código-fonte]

A altura é uma propriedade psicofísica emergente. A saliência e ‘altura’ da altura dependem de vários fatores, embora contidos num grupo específico de frequências harmónicas e fundamentais, chamada “Região de existência”. A saliência da altura é em grande parte determinada pela regularidade da repetição de segmentos do som; a ‘altura’ da altura é definida pela taxa de repetição, também conhecida como frequência de modulação. O conjunto de sons capaz de evocar a percepção da altura é diverso e espectralmente heterogéneo. Vários estímulos diferentes - incluindo tons puros, sequências de cliques, ruídos ondulatórios iterativos, sons de amplitude modulada, entre outros - podem evocar uma percepção da altura, enquanto outros sinais acústicos, mesmo que com características físicas muito semelhantes aos anteriores podem não evocar uma resposta à altura. A maioria dos sons que evocam uma resposta à altura e que ocorrem naturalmente são complexos harmónicos - sons que contêm um espectro de frequências que são múltiplos inteiros da frequência fundamental, F0. Uma descoberta importante das pesquisas sobre a altura é o fenómeno da ‘Frequência fundamental ausente’ (ver abaixo): dentro de uma determinada faixa de frequência, toda a energia espectral em F0 pode ser removida de um complexo harmónico, e ainda assim evocar uma resposta a altura correlacionado com F0 num ouvinte humano [1]. Esta descoberta aparenta poder ser generalizada para vários sistemas auditivos não-humanos [2][3].

Altura da Frequência fundamental ausente. Espectrógrafos de áudio para a melodia de 'Mary had a little lamb’. (Esquerda) Melodia tocada com tons puros (frequência fundamental), (centro) melodia tocada com a frequência fundamental e com seis sobre-tons harmónicos (direita) melodia tocada apenas com sobre-tons harmónicos e com a energia espectral na frequência fundamental removida. Como demonstrado nos clipes de áudio correspondentes à esquerda, estas três melodias diferem em timbre, mas a altura permanece inalterada, apesar da ‘Frequência fundamental ausente’ e das melodias de tons puros não terem componentes espectrais em comum.




O fenómeno da ‘Frequência fundamental ausente’ é importante por duas razões. Em primeiro lugar, é uma referência importante para avaliar se neurónios específicos ou regiões do cérebro são especializados no processamento da altura, visto que é expectável que estas unidades demonstrem actividade referente a F0 (e, por conseguinte à altura), independentemente da sua presença no som ou noutros parâmetros acústicos. De forma genérica, um ‘neurónio de resposta a altura’ ou um ‘centro da altura’ deve mostrar uma atividade consistente em resposta a todos os estímulos que evocam uma percepção particular da ‘altura’ da altura. Como será analisado, esta possibilidade tem sido uma fonte de desacordo na identificação de potenciais neurónios ou áreas de resposta a altura. Em segundo lugar, a capacidade de percepcionar uma altura correspondente a F0, mesmo quando este está ausente no estímulo auditivo, fornece uma forte evidência contra o facto de o cérebro ter implementado um mecanismo para ‘utilizar’ F0 para inferir directamente a altura. Em vez disso, a altura deve ser extraída de indicações temporais ou espectrais (ou ambas) [4].

Mecanismos de extração da altura: indicações espectrais e temporais[editar | editar código-fonte]

Harmónicos resolvidos e não resolvidos. Esquema de um espectro, padrão de excitação e simulação da vibração da membrana basilar (MB) para uma nota complexa com uma F0 de 100 Hz e frequências harmónicas de igual amplitude. Como pode ser visto no padrão de excitação e nas vibrações MB, harmónicos de ordem maior são “não resolvidos”, isto é, não há separação efectiva dos harmónicos individuais. (Descrição adaptada do autor original. Disponível em : http://www.europeanmedical.info/auditory-nerves/resolved-and-unresolved-harmonics-341-defining-resolvability.html)

Estas duas indicações (espectrais e temporais) são as bases de duas classes principais de modelos de extração da altura[4]. O primeiro destes são os métodos no domínio temporal, que utilizam indicações temporais para avaliar se um som é composto por segmentos repetidos e, em caso afirmativo, a taxa de repetição. Um método geralmente proposto para aplicar esta técnica é a autocorrelação. Uma função de autocorrelação envolve essencialmente encontrar os atrasos de tempo entre dois pontos de amostragem que darão a correlação máxima: por exemplo, uma onda de som com uma frequência de 100Hz (ou período, T=10 milissegundos) teria uma correlação máxima se as amostras forem tiradas em intervalos de 10 milissegundos. Para uma onda de 200Hz, o atraso que gera uma correlação máxima seria de 5 milissegundos, mas também a 10 milissegundos, 15 milissegundos, e assim por diante. Assim, se esta função for realizada em todas as frequências que compõem um complexo harmónico com F0=100Hz (tendo assim sobre-tons harmónicos a 200Hz, 300Hz, 400Hz, e assim por diante), e os intervalos de tempo resultantes que dão uma correlação máxima forem somados, eles iriam ‘votar’ coletivamente em 10 milissegundos - a periodicidade do som. A segunda classe de estratégias de extracção da altura são os métodos no domínio da frequência, nos quais a altura é extraída através da análise do espectro de frequências de um som para calcular F0. Por exemplo, o processo de ‘Corresponência de modelos padrão’ - como ‘o filtro de harmónicos’ - propõem que o espectro de frequência de um som seja simplesmente comparado com modelos harmónicos padrão - sendo que a melhor correspondência representa o F0 correcto [5].

Existem limitações em ambas as classes de explicações. Os métodos no domínio da frequência exigem que as frequências harmónicas sejam resolvidas - ou seja, cada harmónico deve ser representado como uma banda de frequência distinta (ver a figura à direita). No entanto, harmónicos de ordem superior, que não são resolvidos devido à maior largura de banda na representação fisiológica de frequências mais elevadas (consequência da organização tonotópica logarítmica da membrana basilar) conseguem evocar uma altura correspondente a F0. Os modelos temporais não têm este problema, uma vez que a função de autocorrelação deve produzir a mesma periodicidade, independentemente da função ser executada em um ou mais canais de frequência. Contudo, é difícil atribuir os limites inferiores das frequências evocadoras da altura à autocorrelação: estudos psicofísicos demonstram que é possível percepcionar a altura de complexos harmónicos com frequências fundamentais ausentes tão baixas quanto 30Hz; o que corresponde a um atraso de amostragem superior a 33 milissegundos - muito maior do que o atraso de ~10 milissegundos geralmente observado na sinalização neural [4].

Harmónicos da fase sinusoidal (esquerda) e da fase alternada (direita). Estes complexos têm a mesma F0 (125 Hz) e os mesmos números harmónicos, mas a altura do complexo à direita é uma oitava maior do que a altura do complexo à esquerda. Ambos os complexos foram filtrados ​​entre 3900 e 5400 Hz. (Descrição do autor original. Disponível em: http://www.europeanmedical.info/auditory-nerves/resolved-and-unresolved-harmonics-341-defining-resolvability.html)

Uma forma para determinar qual destas duas estratégias é utilizada pelo sistema auditivo é o uso de harmónicos de fase alternada: apresentando harmónicos ímpares com uma fase sinusoidal e harmónicos pares com fase cosseno. Visto que tal não afecta o conteúdo espectral do estímulo, não haverá nenhuma mudança na percepção da altura se o ouvinte depender principalmente de indicações espectrais. Por outro lado, a taxa de repetição do envelope temporal irá duplicar. Assim, se forem utilizadas indicações de envelope temporal, a altura percepcionada pelo ouvinte para harmónicos de fase alternada será uma oitava acima (ou seja, o dobro da frequência) da altura percepcionada para todos os harmónicos cosseno com a mesma composição espectral. Estudos psicofísicos têm investigado a sensibilidade da percepção da altura a mudanças de fase para diferentes F0 e intervalos de harmónicos, apresentando evidências de que, quer os seres humanos [6] quer outros primatas [7], adoptam uma estratégia dupla: sinais espectrais são utilizados para harmónicos resolvidos de ordem mais baixa, enquanto que indicações de envelopes temporais são usadas para harmónicos não resolvidos de ordem superior.

Extração da altura na via auditiva ascendente[editar | editar código-fonte]

As fracções de Weber para discriminação da altura foram reportadas como sendo inferiores a 1% em seres humanos [8]. Dada esta elevada sensibilidade a alterações na altura, e a demonstração de que ambas as indicações espectrais e temporais são utilizadas para a extracção da altura, é possível prever que o sistema auditivo representa tanto a composição espectral como a estrutura fina temporal dos estímulos acústicos de uma forma muito precisa, até estas representações serem eventualmente transmitidas explicitamente para neurónios que respondem a alturas específicas ou a estímulos periódicos.

Experiências eletrofisiológicas identificaram respostas neuronais no sistema auditivo ascendente que são consistentes com esta noção. A partir do nível da cóclea, os movimentos da membrana basilar (MB) mapeados tonotopicamente em resposta a estímulos auditivos estabelecem uma selectividade espacial para a composição da frequência ao longo do eixo da MB. Estas representações são reforçadas por uma fixação de fase das fibras do nervo auditivo (FNA) para os componentes de frequência aos quais ela responde. Este mecanismo para representação temporal da composição da frequência é ainda melhorado de várias formas, tais como a inibição lateral na sinapse da célula ciliada / gânglio espiral [9], suportando a noção de que esta representação precisa é essencial para a codificação da altura.

Assim, nesta fase, os padrões dos picos temporais de fase fixa das FNA contêm provavelmente uma representação implícita da periodicidade. Esta hipótese foi testada por Cariani e Delgutte[10]. Ao analisar a distribuição dos intervalos inter-picos de todas as ordens (IIP) nas FNA de gatos, foi mostrado que o IIP mais comum era a periodicidade do estímulo, e o rácio de Pico-Média destas distribuições aumentava para estímulos complexos que evocavam percepções da altura mais salientes. Com base nestes resultados, os autores propuseram a “hipótese do intervalo predominante”, na qual um grupo com o código dos IIP de todas as ordens ‘vota’ na periodicidade - embora, esta descoberta seja uma consequência inevitável das respostas de fase fixa das FNA. Além disso, existem evidências de que a selectividade espacial para os componentes de frequência também é crítica. Ao cruzar um estímulo de baixa frequência com um transportador de alta frequência, Oxenham et al transpuseram a estrutura fina temporal da sinusóide de baixa frequência para as regiões de maior frequência ao longo da MB.[11]. Isto levou a uma deficiência nas capacidades de discriminação da altura. Assim, tanto a codificação espacial e temporal representam informações relacionadas com altura nas FNA.


O nervo auditivo transporta informação para o núcleo coclear (NC). Neste local, várias tipos de células representam informação relacionada com a altura de diferentes formas. Por exemplo, várias células peludas aparentam ter diferenças mínimas na capacidade de excitar fibras do nervo auditivo - a informação pode ser transportada para regiões cerebrais de ordem superior sem sofrer modificações significativas[4]. Um exemplo particularmente interessante é dado pelas células de corte contínuo no núcleo coclear ventral. De acordo com Winter e os seus colegas, os intervalos dos picos de primeira ordem destas células correspondem à periodicidade em resposta a estímulos de ruído ondulatório iterativo (ROI), bem como a complexos harmónicos de fase cosseno e aleatória, que são invariantes ao nível do som[12]. Embora seja necessária uma caracterização mais detalhada das respostas celulares a estímulos que induzem respostas a diferentes alturas, existe alguma evidência de que a extração da altura do som tem início ao nível do NC.

No colículo inferior (CI), existe alguma evidência que a taxa de resposta média dos neurónios é igual à periodicidade do estímulo[13]. Estudos posteriores que compararam as respostas de neurónios do CI a complexos harmónicos com a mesma fase e de fase alternada sugerem que estas células sejam capazes de responder à periodicidade do nível de energia global (ou seja, o envelope), em vez da frequência de modulação verdadeira. Ainda assim, não é evidente se tal se aplica apenas para harmónicos não resolvidos (como seria previsto por experiências psicofísicas) ou também para harmónicos resolvidos[4]. Ainda existem bastantes incertezas em relação à representação da periodicidade no CI.

Codificação da altura do som no córtex auditivo[editar | editar código-fonte]

Assim, existe a tendência para realçar as representações de F0 ao longo do sistema auditivo ascendente, embora a natureza precisa deste se mantenha pouco clara. Por outro lado, nos pontos sub-corticais da via auditiva ascendente, não existe evidência para uma representação explícita que consistentemente codifique informação relativa à altura percepcionada. Provavelmente, tais representações ocorrem em regiões auditivas ‘superiores’, a partir do córtex auditivo primário.

De facto, estudos relativos a lesões auditivas demonstraram a importância do córtex auditivo para a percepção da altura. Obviamente, a incapacidade na detecção da altura do som no seguimento de lesões no córtex auditivo pode simplesmente refletir uma função passiva de transmissão para o córtex: por onde a informação subcortical tem de passar para afetar o comportamento. Ainda assim, estudos como os desenvolvidos por Whitfield demonstraram que, provavelmente, tal não será o que se verifica na realidade: enquanto gatos aos quais fora removido o córtex auditivo (por ablação) podiam ser re-treinados para reconhecer tons complexos formados por três frequências distintas, os animais perderam seletivamente a habilidade de generalizar estes tons para outros sons complexos com a mesma altura[14]. Por outras palavras, enquanto a composição harmónica podia influenciar o comportamento, relações harmónicas (tais como sugestões relativas à altura do som) não tinham esta capacidade. Por exemplo, o animal lesionado conseguia responder corretamente a um tom puro de 100Hz, mas não a um tom complexo composto pelos seus sobre-tons harmónicos (a 200Hz, 300Hz, e assim sucessivamente). Esta observação sugere que o córtex auditivo tem um papel fundamental na extração de informação relativa à altura do som.

Estudos primários com Magnetoencefalografia (MEG) sugeriram que A1 continha um mapa da altura. Esta conclusão baseou-se nas observações de que um tom puro e o seu complexo harmónico com a frequência fundamental ausente (FFA) produzia uma excitação resultante de estímulo externo (chamada N100m) no mesmo local, enquanto que as componentes das frequências do harmónico com FFA apresentadas individualmente produziam excitações em locais distintos[15]. Ainda assim, estas noções foram encobertas por resultados experimentais que recorreram a técnicas com maior resolução espacial: Potencial de campo local (PCL) e Registo de Multi-Unidades (RMU) demonstraram que o mapeamento de A1 era tonotópico - isto é, baseado na melhor frequência (MF) dos neurónios, em vez da melhor ‘altura’[16]. Ainda assim, estas técnicas demonstram a emergência de mecanismos de codificação distintos para a extração de sugestões temporais e espaciais: a representação de fase fixa da taxa de repetição do envelope temporal era registada nas regiões de MF superiores do mapa tonotópico, enquanto a estrutura harmónica da sequência de cliques era representada em regiões de MF inferiores[17]. Assim, as sugestões para a extração da altura do som podem ser potenciadas a este nível.

Ilustração esquemática de neurónios com multi-picos. A linha ponteada azul mostra a curva do tom genérica para uma frequência com um neurónio específico de uma frequência ‘mono-pico’ com a melhor frequência (MF) a aproximadamente 500Hz, como ilustrado pela resposta máxima do neurónio para frequências em torno deste valor. A linha vermelha mostra uma resposta esquemática de um neurónio que responde a várias frequências (‘multi-pico’) identificado por Kadia e Wang (2003). Além da MF a 300Hz, este neurónio também é estimulado por tons a 600Hz e 900Hz - ou seja, frequências em relação harmónica à MF principal. Embora não seja ilustrado aqui, as respostas deste tipo de neurónios a harmónicos complexos (neste caso, compostos pelas frequências 300, 600 e 900Hz) têm usualmente um efeito aditivo, gerando respostas mais intensas do que para um tom puro à frequência correspondente a MF (neste caso, 300 Hz), isoladamente. Ver referência [18]

Um exemplo de um substrato neuronal que poderá facilitar um reforço deste tipo foi descrito por Kadia e Wang, em relação ao córtex auditivo primário de Saguis [18]. Cerca de 20% dos neurónios nesta região podiam ser classificados como unidades ‘multi-pico’: neurónios que têm múltiplas áreas de resposta à frequência, geralmente em relação harmónica (ver figura à direita). Além disso, a excitação de dois destes picos espectrais apresentou um efeito sinergético nas respostas dos neurónios. Tal efeito iria assim facilitar a extração de tons relacionados harmonicamente no estímulo acústico, permitindo a estes neurónios actuar como ‘modelos harmónicos’ para a extração de sugestões espectrais. Adicionalmente, estes autores observaram que, na maioria dos neurónios ‘mono-pico’ (isto é, neurónios com um único pico espectral na região da MF), um tom secundário podia ter um efeito modulatório, facilitando ou inibindo, a resposta do neurônio à sua MF. De novo, estas frequências modulatórias estavam geralmente relacionadas harmonicamente com a MF. Estes mecanismos facilitadores podem assim acomodar a extração de certos componentes harmónicos e rejeitar outros por modulação inibitória, permitindo a distinção entre outros complexos harmónicos e não harmónicos (tais como ruído de banda larga).

'Regiões de altura’ potenciais no plano supra-temporal no ser humano. (A) Visão lateral do hemisfério esquerdo, com o Giro superior temporal (GST) indicado a vermelho. (B–D) Visão superior do plano supra-temporal esquerdo, após remoção de grande parte do córtex parietal. PP, GH, e PT estão indicados a azul, amarelo e verde, respetivamente. Os Sulcos major (major sulci) estão indicados a preto (FTS refere-se ao primeiro sulco transverso; SI ao sulco intermédio ou sulcus intermediate; HS ao Sulco de Heschl; HS1 ao Primeiro sulco de Heschl; HS2 ao segundo sulco de Heschl). As figuras incluem hemisférios com um GH, uma separação incompleta de GH e dois GH em (B-D), respetivamente.

Contudo, dado que a tendência para reforçar F0 foi demonstrada ao longo de todo o sistema auditivo sub-cortical, poderia esperar-se que se estaria perto de uma representação mais explícita da altura no córtex. Experiências com recurso a neuroimagiologia exploraram esta ideia, considerando uma qualidade emergente da altura: um método subtractivo consegue identificar áreas no cérebro que mostram respostas BOLD em relação a estímulos que produzem respostas à altura, mas não a outro som com propriedades espectrais muito semelhantes, mas que não provoca uma percepção à altura. Estas estratégias foram utilizadas por Patterson, Griffiths e colegas: ao subtrair o sinal BOLD adquirido durante a apresentação de ruído de banda-larga ao sinal adquirido durante a apresentação do ROI, foi possível identificar uma ativação seletiva do giro Heschl (GH) lateral (e, em parte, medial) em resposta à última classe de sons que produzem uma resposta a altura[19]. Além disso, ao variar a taxa de repetição do ROI ao longo do tempo foi possível criar uma melodia que produziu uma ativação adicional no giro superior temporal (GST) e plano polar (planum polare, PP), sugerindo um processamento hierárquico da altura do som ao longo do córtex auditivo. Do mesmo modo, os registos de MEG por Krumbholz et al. mostraram que, à medida que a taxa do estímulo de ROI aumenta, um estímulo N100m novo era detectado na região do GH à medida que a taxa de repetição atravessa o limiar inferior para a percepção da altura, e a magnitude desta ‘resposta à altura’ aumentava com a saliência da altura[20].

Ainda assim, existe alguma controvérsia relativamente à localização precisa da área seletiva da altura do som. Como referiram Hall e Plack, o uso exclusivo de estímulos de ROI para identificar áreas corticais sensíveis à altura é insuficiente para captar a vasta gama de estímulos que podem induzir uma resposta à altura: a ativação do GH pode ser específica a estímulos de banda-larga repetitivos[21]. De facto, com base nos sinais BOLD observados em resposta a vários estímulos que induzem resposta à altura, Hall e Plack sugeriram que o plano temporal (planum temporale, PT) é mais relevante para o processamento da altura.

Embora se observe um desacordo sobre a área neural exata especializada na codificação da altura, este tipo de evidência sugere que regiões entre a zona anterolateral e A1 possam ser especializadas para a percepção da altura. Um suporte adicional para esta noção é dado pela identificação de neurónios que respondem a alturas específicas na borda anterolateral de A1 no córtex auditivo do sagui. Estes neurónios respondiam selectivamente a tons puros e harmónicos com F0 ausente com periodicidades semelhantes[22]. Muitos destes neurónios também eram sensíveis à periodicidade de outros estímulos que produziam resposta à altura, tais como sequências de cliques ou ROI. Estas observações constituem uma forte evidência para o facto de estes neurónios não apresentarem uma resposta a qualquer componente particular de um sinal acústico, mas representam especificamente informação relacionada com a altura do som.

Codificação da Periodicidade ou codificação da altura?[editar | editar código-fonte]

Existe uma evidência crescente que sugere que existem neurónios e áreas neurais especializadas em extrair F0, provavelmente, em zonas antero-laterais a regiões de MF inferiores de A1. Contudo, existe alguma dificuldade em designar estes neurónios ou áreas como ‘seletivas à altura’. Enquanto o estímulo F0 é indiscutivelmente um elemento determinante da altura do som, não é necessariamente equivalente à altura percepcionada pelo ouvinte.

Ainda assim, existem algumas evidências que sugerem que estas regiões são efetivamente responsáveis por codificar a altura e não apenas F0. Por exemplo, investigações mais detalhadas das unidades selectivas da altura do som em Saguis realizadas por Bendor e os seus colegas demonstraram que a atividade nestes neurónios corresponde fielmente às respostas psicofísicas dos animais[7]. Estes autores testaram as habilidades dos animais para detectar um complexo harmónico de fase alternada entre a apresentação de harmónicos com a mesma fase à mesma frequência F0, a fim de distinguir em que situações os animais recorriam às sugestões dos envelopes temporais para a percepção da altura, em vez de sugestões espectrais. De acordo com experiências psicofísicas em humanos, os saguis usavam primariamente sugestões de envelopes temporais de ordem superior, harmónicos não resolvidos de frequência F0 baixa, enquanto sugestões espectrais eram usadas para extrair a altura de harmónicos de ordem inferior de complexos de F0 elevada. Registos destes neurónios selectivos a altura mostraram que o ajuste de F0 ocorria uma oitava abaixo para harmónicos de fase alternada, em comparação com harmónicos com a mesma fase em neurónios ajustados para frequências F0 baixas. Estes padrões de resposta neuronais são consistentes com os resultados psicofísicos, sugerindo que quer as sugestões temporais e espectrais são integradas nestes neurónios para influenciar a percepção da altura.

Ainda assim, de novo, este estudo não conseguiu distinguir definitivamente se estes neurónios que respondem a alturas específicas conseguem representar a altura explicitamente ou simplesmente integram informação sobre F0 que será posteriormente descodificada para percepcionar a altura. Uma abordagem mais direta para analisar este tópico foi apresentada por Bizley et al, que analisaram como medições do córtex auditivo PCL e RMU em furões podiam ser usados independentemente para estimar o estímulo F0 e a percepção da altura[23]. Enquanto os furões eram envolvidos numa tarefa de discriminação da altura (para indicar se um som de uma vogal artificial era superior ou inferior em altura a uma referência num paradigma de 2-escolhas forçadas), uma análise da Característica de Operação de Receptor (COR) foi usada para estimar a discriminabilidade da atividade neural em prever a alteração de F0 ou a escolha efetiva resultante (como representação da altura percepcionada). Descobriram que as respostas neurais ao longo do córtex auditivo eram informativas em relação a ambos. Inicialmente, a atividade permitia distinguir melhor F0 do que a escolha do animal, mas a informação relativa à escolha do animal aumentava consistentemente ao longo do intervalo pós-estímulo, tornando-se eventualmente mais discriminável do que a direção da alteração de F0[23].

Comparando as diferenças em COR entre as áreas corticais estudadas, mostrou-se que campos posteriores de atividade permitiam discriminar melhor a escolha dos furões. Este resultado pode ser interpretado de duas formas. Visto que a atividade relacionada com a escolha era superior nos campos posteriores (que se encontram na borda inferior MF de A1), em comparação com os campos primários, tal pode ser entendido como uma evidência adicional para a seletividade para a altura perto da borda MF inferior de A1. Por outro lado, o facto de informação relacionada com a altura também ser observada nos campos auditivos primários pode sugerir que informação suficiente relacionada com a altura esteja já estabelecida neste nível, ou que um código distribuído ao longo de várias áreas auditivas codifiquem a altura. De facto, enquanto neurónios individuais distribuídos ao longo do córtex auditivo são geralmente sensíveis a vários parâmetros acústicos (e, portanto, não respondem especificamente à altura), informação teórica ou análises neurométricas (usando dados neurais para inferir informação relacionada com o estímulo sonoro) indicam que a informação da altura pode ser representada de forma robusta através de codificação de populações, ou até por neurónios individuais através de multiplexação temporal (isto é, representando várias características do som em diferentes janelas temporais)[24][25]. Assim, na ausência de estimulação ou desativação destas potenciais áreas ou neurónios específicos para altura do som para demonstrar que tais intervenções produzem desequilíbrios previsíveis ou enfraquecimentos na altura, pode supor-se que a altura seja representada temporalmente e espacialmente através de códigos distribuídos ao longo do córtex, em vez de recorrer a representações locais especializadas.

Assim, quer registos electrofisiológicos quer estudos de neuro-imagiologia sugerem que exista um código neural explícito para a altura que se encontra perto da borda MF inferior de A1. Definitivamente, as respostas seletivas e consistentes a uma larga gama de estímulos que induzem uma resposta à altura sugerem que estas potenciais áreas e neurónios específicos para a altura não estão simplesmente a reflectir qualquer característica física do sinal acústico que está disponível de imediato. Além disso, existe evidência que estes potenciais neurónios que respondem à altura são capazes de extrair informação de sugestões espectrais e temporais da mesma forma que os animais. Contudo, por virtude de uma relação abstrata entre a altura e o sinal acústico, esta correlação entre um estímulo e uma resposta neural só pode ser interpretada como evidência de que o sistema auditivo tem a capacidade de formar representações melhoradas de parâmetros relacionados com a altura. Sem uma evidência causal mais direta para estes potenciais neurónios que respondem especificamente à altura e áreas neurais que determinam a percepção à altura, não é possível concluir se os animais recorrem efetivamente a códigos localizados explicitamente para altura, ou se as representações distribuídas e robustas da altura ao longo do córtex auditivo definem a codificação final da altura no sistema auditivo.

Referências[editar | editar código-fonte]

  1. Schouten, J. F. (1938). The perception of subjective tones. Proceedings of the Koninklijke Nederlandse Akademie van Wetenschappen, 41, 1086-1093.
  2. Cynx, J. & Shapiro, M. Perception of missing fundamental by a species of songbird (Sturnus vulgaris). J Comp Psychol 100, 356–360 (1986).
  3. Heffner, H., & Whitfield, I. C. (1976). Perception of the missing fundamental by cats. The Journal of the Acoustical Society of America, 59(4), 915-919.
  4. 4,0 4,1 4,2 4,3 4,4 Schnupp, J., Nelken, I. & King, A. Auditory neuroscience: Making sense of sound. (MIT press, 2011).
  5. Gerlach, S., Bitzer, J., Goetze, S. & Doclo, S. Joint estimation of pitch and direction of arrival: improving robustness and accuracy for multi-speaker scenarios. EURASIP Journal on Audio, Speech, and Music Processing 2014, 1 (2014).
  6. Carlyon RP, Shackleton TM (1994). "Comparing the fundamental frequencies of resolved and unresolved harmonics: Evidence for two pitch mechanisms?" Journal of the Acoustical Society of America 95:3541-3554
  7. 7,0 7,1 Bendor D, Osmanski MS, Wang X (2012). "Dual-pitch processing mechanisms in primate auditory cortex," Journal of Neuroscience 32:16149-61.
  8. Tramo, M. J., Shah, G. D., & Braida, L. D. (2002). Functional role of auditory cortex in frequency processing and pitch perception. Journal of Neurophysiology, 87(1), 122-139.
  9. Rask-Andersen, H., Tylstedt, S., Kinnefors, A., & Illing, R. B. (2000). Synapses on human spiral ganglion cells: a transmission electron microscopy and immunohistochemical study. Hearing research, 141(1), 1-11.
  10. Cariani, P. A., & Delgutte, B. (1996). Neural correlates of the pitch of complex tones. I. Pitch and pitch salience. Journal of Neurophysiology, 76(3), 1698-1716.
  11. Oxenham, A. J., Bernstein, J. G., & Penagos, H. (2004). Correct tonotopic representation is necessary for complex pitch perception. Proceedings of the National Academy of Sciences of the United States of America, 101(5), 1421-1425.
  12. Winter, I. M., Wiegrebe, L., & Patterson, R. D. (2001). The temporal representation of the delay of iterated rippled noise in the ventral cochlear nucleus of the guinea-pig. The Journal of physiology, 537(2), 553-566.
  13. Schreiner, C. E. & Langner, G. Periodicity coding in the inferior colliculus of the cat. II. Topographical organization. Journal of neurophysiology 60, 1823–1840 (1988).
  14. Whitfield IC (1980). "Auditory cortex and the pitch of complex tones." J Acoust Soc Am. 67(2):644-7.
  15. Pantev, C., Hoke, M., Lutkenhoner, B., & Lehnertz, K. (1989). Tonotopic organization of the auditory cortex: pitch versus frequency representation.Science, 246(4929), 486-488.
  16. Fishman YI, Reser DH, Arezzo JC, Steinschneider M (1998). "Pitch vs. spectral encoding of harmonic complex tones in primary auditory cortex of the awake monkey," Brain Res 786:18-30.
  17. Steinschneider M, Reser DH, Fishman YI, Schroeder CE, Arezzo JC (1998) Click train encoding in primary auditory cortex of the awake monkey: evidence for two mechanisms subserving pitch perception. J Acoust Soc Am 104:2935–2955.
  18. Kadia, S. C., & Wang, X. (2003). Spectral integration in A1 of awake primates: neurons with single-and multipeaked tuning characteristics. Journal of neurophysiology, 89(3), 1603-1622.
  19. Patterson RD, Uppenkamp S, Johnsrude IS, Griffiths TD. (2002) "The processing of temporal pitch and melody information in auditory cortex," Neuron 36:767-776.
  20. Krumbholz, K., Patterson, R. D., Seither-Preisler, A., Lammertmann, C., & Lütkenhöner, B. (2003). Neuromagnetic evidence for a pitch processing center in Heschl’s gyrus. Cerebral Cortex, 13(7), 765-772.
  21. Hall DA, Plack CJ (2009). "Pitch processing sites in the human auditory brain," Cereb Cortex 19(3):576-85.
  22. Bendor D, Wang X (2005). "The neuronal representation of pitch in primate auditory cortex," Nature 436(7054):1161-5.
  23. 23,0 23,1 Bizley JK, Walker KMM, Nodal FR, King AJ, Schnupp JWH (2012). "Auditory Cortex Represents Both Pitch Judgments and the Corresponding Acoustic Cues," Current Biology 23:620-625.
  24. Walker KMM, Bizley JK, King AJ, and Schnupp JWH. (2011).Multiplexed and robust representations of sound features in auditory cortex. Journal of Neurosci 31(41): 14565-76
  25. Bizley JK, Walker KM, King AJ, and Schnupp JW. (2010). "Neural ensemble codes for stimulus periodicity in auditory cortex." J Neurosci 30(14): 5078-91.