Você fez duas perguntas diferentes e mutuamente exclusivas. Gravação binaural é uma coisa, usando vários microfones para melhorar a sensação de localização é totalmente diferente. Gravações de binaural usam exatamente dois microfones especiais que são montados dentro de uma cabeça protética que é uma réplica em tamanho natural de uma cabeça humana comum. O efeito de uma gravação binaural só funciona quando ouvida com fones de ouvido - ela não funciona com nenhum tipo de sistema de alto-falantes, por isso seria difícil vender um filme para cinemas ou pessoas que tivessem áudio binaural.
Então, há a questão de se produção de som (ou seja, o som gravado durante as filmagens) pode ser gravado usando vários microfones usados para criar uma sensação de espaço, e a resposta é que é improvável. Geralmente, o som de produção serve para capturar o diálogo somente como parte da atuação. Todos os outros sons são adicionados mais tarde como efeitos criados digitalmente, música, faixas de foley, etc. As faixas de som que não são diálogos são às vezes multi-miked para criar um soundscape (uma trilha sonora orquestral é muito comum exemplo), mas há uma boa razão pela qual a caixa de diálogo é quase sempre misturada a uma única faixa mono e reproduzida pelo alto-falante do canal central (ou dividida igualmente entre esquerda e direita ou esquerda frontal e direita quando não há canal central) .
Quando filmes são distribuídos no exterior, geralmente a caixa de diálogo é substituída por um dub da caixa de diálogo no idioma do país de destino. Isso significa que o diálogo não pode ser completamente misturado com os outros elementos do filme, ao invés disso, ele é mantido como um tronco separado . Isso também permite que as versões em DVD / digital / streaming tenham várias faixas de idiomas sem precisar ter cópias inteiras de todo o mix de som surround para cada idioma.
Se você fez tentar gravar todos os elementos sonoros de um filme com múltiplos microfones unidirecionais em uma matriz para replicar os alto-falantes de, digamos, um sistema 5.1, você rapidamente se depararia com um enorme número de problemas. Logo de cara, você teria que configurar o array exatamente da mesma maneira todas as vezes para todo elemento que entra no filme ou então quando você tenta misturá-los todos juntos, vai ser uma bagunça enorme. Segundo, você não pode controlar o posicionamento das caixas acústicas finais de reprodução, exceto, talvez, em um teatro THX, o que significa que o posicionamento que você gravou cuidadosamente será desativado quando a maioria das pessoas assiste ao filme. Há também enormes desafios de engenharia de áudio com configurações de multi-mic, como problemas de cancelamento de fase, e como você vai configurá-lo dentro de um carro ou banheiro ou outro espaço pequeno? Se você tiver algumas fotos com o "áudio espacial" e outras sem, a diferença será óbvia e dissonante.
A melhor solução global para o som surround, tanto do ponto de vista estético quanto comercial, é a atual: elementos separados são gravados em isolamento, geralmente em mono ou estéreo, e então os elementos são misturados em hastes surround usando paners surround e LFE separados alimenta, enquanto a caixa de diálogo é mantida como uma haste mono e alimentada ao canal central (que em um teatro está atrás da tela).