Áudio Digital

 

Com os avanços tecnológicos ao nível da ciência de computadores e das tecnologias de informação verificamos que em qualquer vertente da indústria do entretenimento e da informação, a manipulação e síntese de som com tecnologia digital assume um papel cada vez mais importante.

Nos dias de hoje a composição de som através de dispositivos electrónicos já não é um privilégio de apenas alguns especialistas com acesso a estúdios ou laboratórios extremamente sofisticados.

Um computador pessoal genérico está preparado para aquisição e edição de som em formato digital de alta qualidade.

Foi colocado ao alcance de utilizadores comuns um enorme potencial criativo, abrindo perspectivas ao nível da manipulação e síntese de som com características profissionais, adequada a uma grande variedade de suportes tais como a Multimédia, o Vídeo ou mesmo a Performance Musical.

 

 

– Características do som: frequência, amplitude e timbre


Geralmente, a percepção do mundo que nos rodeia é originada pela interpretação de fenómenos ondulatórios pelo nosso corpo.

Define-se como uma onda um fluxo de energia que aumenta e diminui de intensidade ao longo do tempo e do espaço.

Da mesma forma que a percepção visual não é mais do que a interpretação cerebral da reflexão de ondas de luz em corpos físicos, captada através dos olhos, também a sensação de ouvir som se deve à reacção do nosso corpo a ondas derivadas da variações de pressão atmosférica que os objectos provocam ao deslocarem-se no espaço.

Esta variação de pressão propaga-se através da atmosfera desde a origem da perturbação até aos nossos ouvidos.

Os ouvidos traduzem as variações provocadas na membrana auricular para o cérebro através de pequenos choques eléctricos criando a percepção sonora.

A Frequência traduz o número de ciclos por segundo numa forma de onda periódica e é uma das grandezas mais relevantes na caracterização de som.

A unidade de medida de frequência é o Hertz (Hz).

O valor da Frequência de uma forma de onda periódica pode variar desde 0

Hz (forma de onda não oscilatória) até um valor virtualmente infinito.

O espectro possível de Frequências contém vários tipos de ondas com características e aplicações práticas a vários níveis, sendo possível para o ouvido humano a percepção de ondas com frequências entre os 20Hz e os 20.000 Hz para formas de onda periódicas contínuas.

Apesar dos valores de Frequência audíveis pelo ser humano se situarem na gama dos 20Hz aos 20KHz, está comprovado que tanto Frequências abaixo de 20 Hz (infra-sons) como frequências superiores a 20 KHz (ultra-sons), são percepcionadas pelo nosso corpo provocando uma reacção do nosso cérebro, que pode ser classificada como no mínimo subliminar.

A Amplitude é a grandeza que quantifica a intensidade com que ouvimos os sons, cuja variação é proporcional à perturbação de pressão na atmosfera que as ondas sonoras.

A unidade de medida de Amplitude de som é o Decibel (dB), sendo que esta unidade representa a menor variação de som em Amplitude perceptível pelo ouvido humano (1dB).

Em média o ouvido Humano consegue processar com clareza variações de Amplitude de som entre os 0 dB e os 120 dB (sons superiores a 120 dB provocam dor), designando-se esta gama de valores como gama dinâmica efectiva da audição humana.

Grande parte de estudos realizados sobre a sensibilidade auditiva em função da Amplitude alertam para o facto de que a exposição do ouvido Humano a Amplitudes de som superiores a 90 dB pode provocar danos permanentes.

O Timbre é a característica sonora que nos permite distinguir sons com a mesma frequência de diferentes fontes sonoras. Embora este fenómeno seja conhecido há séculos, somente há algumas décadas, com o advento da electrónica foi possível compreendê-lo com mais precisão.

Quando ouvimos, por exemplo, uma nota tocada por um piano e a mesma nota (uma nota com a mesma altura) produzida por um violino, podemos imediatamente identificar os dois sons como tendo a mesma frequência, mas com características sonoras muito distintas.

O que permite ao ouvido humano diferenciar sons e identificar a sua fonte é a forma da onda e o seu envelope sonoro (forma como o som se inicia, se mantém e termina ao longo do tempo).

Anúncios

– Áudio digital: frequência de amostragem, bits por amostra e critério de Nyquist


Para se transformar um sinal sonoro em sinal digital adequado à manipulação por equipamentos digitais, é necessário convertê-lo da forma analógica (o sinal eléctrico de um microfone, por exemplo) para o formato digital, isto é, códigos numéricos que podem ser interpretados por processadores.

Essa transformação é feita pelos conversores A/D (analógico para digital) que fazem inúmeras fotografias (amostragens) do valor do sinal analógico ao longo do tempo que, por sua vez, são codificados em números digitais, armazenados então na memória do equipamento. Após inúmeros desses valores tem-se a representação completa do sinal analógico original sob a forma de números que podem então ser armazenados nos chips de memória na ordem exacta em que foram colectados, que passam a representar numericamente o sinal original. A velocidade com que as amostragens são colectadas é denominada de Frequência de Amostragem.

A quantificação corresponde ao número de níveis de amplitude que se utiliza para amostrar o sinal, ou seja, a quantificação é a resolução em termos do valor de amplitude que o sinal pode ter num determinado instante. Tipicamente quantifica-se o sinal utilizando 16 bits em gravações com qualidade de CD (16 bits permitem 216 = 65 536 níveis de quantificação), sendo também comum encontrar quantificações de 8 bits em sinais que não precisam de uma boa qualidade e nos sistemas mais recentes já é possível digitalizar um sinal com 32 bits o que traz vantagens em sinais com uma gama dinâmica muito baixa (com baixas amplitudes).

Por definição derivada do teorema de Nyquist (Teorema de Amostragem), para que um sinal analógico depois de digitalizado possa ser novamente recuperado para o domínio analógico sem perca de qualidade, a frequência de amostragem que utilizamos na conversão A/D deverá ser, no mínimo, o dobro da frequência do próprio sinal, se a frequência deste for constante, ou o dobro da frequência do harmónico de frequência mais elevada tratando-se de um sinal genérico.

 

 

– Dispositivos de captura, processamento e reprodução de som digital


A gravação e a reprodução sonora são obtidas através de um equipamento eléctrico ou mecânico de gravação e reprodução de ondas sonoras como a voz, o canto, a música ou os efeitos sonoros. As duas principais classes de tecnologia de gravação são a gravação analógica e a gravação digital.

A gravação analógica é efectuada através de um microfone de diafragma que pode detectar mudanças na pressão atmosférica (ondas sonoras acústicas) e gravá-las como ondas sonoras num equipamento próprio, como um fonógrafo (na qual um estilete cria ranhuras sobre um determinado meio) ou fita magnética na qual as ondas eléctricas saídas de um microfone são convertidas em flutuação electromagnética (fluxo) que modulam um sinal eléctrico. A reprodução sonora analógica é o processo inverso, recorre-se a um altifalante de diafragma e este causa mudanças de pressão atmosférica para formar ondas acústicas. As ondas sonoras geradas electronicamente também podem ser gravadas a partir de dispositivos como um pick-up de guitarra eléctrica ou um sintetizador, sem recorrer à utilização de meios acústicos para a sua captação.

Na gravação e na reprodução sonora digital é usada a mesma tecnologia que a gravação e a reprodução sonora analógica, com o acréscimo da digitalização das ondas sonoras, permitindo, por isso, serem armazenadas e transmitidas através de uma maior variedade de meios de comunicação. Os dados numéricos binários digitais são uma representação dos pontos vectoriais analógicos da informação bruta da taxa de amostragem sonora mais frequentemente em que o ouvido humano tem capacidade para distinguir as diferenças de qualidade. As gravações digitais não têm necessariamente uma maior taxa de amostragem mas são, muitas vezes, considerados de maior qualidade por causa da menor interferência de ruído e de interferências electromagnéticas na reprodução e menor deterioração mecânica da corrosão ou manuseio inadequado do suporte de armazenamento. Um sinal de áudio digital, quando convertido, assemelha-se a um sinal analógico, ao contrário de um sinal digital puro binário que só seria percebido como uma vibração sonora (ruído de fundo) pelo ouvido humano.

– Noções de codificação e compressão de som digital


A codificação de áudio consiste na modificação de características de um sinal para torná-lo mais apropriado para uma aplicação específica, como por exemplo, transmissão ou armazenamento de dados.

A compressão de áudio consiste em eliminar informações redundantes, gerando arquivos de áudio menores. Numa música, um longo período com amostras de som com o mesmo valor, poderia ser substituído por um pequeno código em que a mesma frequência era repetida um certo número de vezes. Pode-se também eliminar informações que exercem pouca influência sobre a qualidade do som, eliminando , assim, pequenas variações.

– Formatos de ficheiros de áudio


– Ogg Vobis
É semelhante aos formatos de compressão MP3 ou AAC mas com a diferença de que é completamente gratuito, sem patentes e de código-fonte aberto.
Os dois termos da palavra podem ser explicados da seguinte forma: Ogg é o “contrainer”, o arquivo que pode conter tanto áudio como vídeo enquanto Vorbis é a compressão de áudio contida nele.
O arquivo Ogg pode ainda conter outros formatos FLAC enquanto formato Vorbis é optimizado para áudio excepto voz, não possuindo uma opção de compressão sem perdas. O arquivo Vobis é facilmente suportado em dispositivos electrónicos de áudio, no entanto é pouco encontrado no mercado.

– WMA (Windows Media Audio)
Formato criado pela Microsoft, o WMA passou por várias mudanças nos últimos anos, com enormes melhorias na qualidade, eficiência e recursos. Actualmente, a tecnologia usada no padrão WMA pode ser usada em quatro tipos diferentes: Windows Media Audio, Windows Media Audio Professional, Windows Media Audio Lossless e Windows Media Voice.

– Wave (ou WAV)
Este formato de arquivo foi criado pela IBM e pela Microsoft nos anos 80. É utilizado em programas profissionais
que processam áudio digital.

– MP3
O formato MP3 (MPEG Layer 3) foi criado nos anos 80 pelo Instituto Fraunhofer juntamente com a Universidade de Erlangen e é um formato padronizado. Actualmente as patentes em relação ao MP3 pertencem à Thompson & Fraunhofer IIS, e são licenciadas pela Thompson. Muitas pessoas pensam que o MP3 é “gratuito” mas, na verdade, é preciso uma licença para vender produtos que codifiquem ou descodifiquem MP3, bem como produtos que façam broadcast de conteúdo em MP3 comercialmente.
O MP3 é um formato com perdas, podendo comprimir áudio em taxas de até 12:1 e providenciar uma boa qualidade sonora. Apesar disso, actualmente já existem outras opções disponíveis de melhor qualidade, tanto em termos de tamanho do arquivo quanto na qualidade sonora.

– MP3 Pro
A mesma Thompson do formato MP3 anteriormente divulgado adquiriu este novo formato em 2001 através de uma parceira com a “Coding Technologies” (de origem sueca), que desenvolveu este formato (com perdas) enquanto fazia pesquisas para equipamento de audição para os surdos. O MP3 Pro garante oferecer a mesma qualidade sonora do MP3 por metade da taxa de bits usada.

– Real Audio
Este formato, com perdas, arquitectado pela empresa Progressive Networks, é um formato muito padronizado e era, até há bem pouco tempo atrás, o formato mais encontrado na Internet (provavelmente por ter sido o primeiro), sendo, então, ultrapassado pelo formato Mp3, pois este último trouxe mais vantagens a vários níveis.

– AAC (Advanced Audio Coding)
“Motion Picture Experts Group” declarou o formato ACC como o formato padrão, em Abril de 1997. Foi desenvolvido pela Fraunhofer Institute em conjunto com companhias como AT&T, Sony e Dolby. Tecnicamente, este formato pode suportar até 48 canais de som de total frequência. Suporta, também, taxas de amostra de até 96KHz, duas vezes mais que o formato MP3. Recentemente foram adicionadas algumas tecnologias extras ao padrão que melhorou a sua qualidade em taxas de bits muito baixas (por exemplo, para uso de telefones). Em taxas mais altas é essencialmente igual ao seu original. Este é um formato com perdas usado para fazer download de músicas no “iTunes Music Store” da Apple, mas como o Grupo que deu origem ao formato não consegue gerir os seus direitos de autor, a Apple teve de usar o seu próprio sistema, o “FairPlay”, nas músicas disponíveis no iTunes. Muitas pessoas pensam que o AAC é um formato gratuito e/ou é um formato aberto porque existem codificadores e descodificadores nalguns programas gratuitos mas, na verdade, não o é.

– AIFF (Audio Interchange File Format)
Este formato suporta uma variedade de resoluções de bit, taxa de amostragem e canais de áudio. É muito popular nos dispositivos electrónicos da Apple (seria o equivalente ao formato Wave para computadores em termos de popularidade) e é bastante usado em programas profissionais que processam áudio digital. Este formato usa o mesmo método da Electronic Arts, em relação ao fomato IFF, para armazenar dados.

– FLAC (Free Lossless Audio Codec)
O formato FLAC é como o formato Vorbis no sentido em que é totalmente gratuito, sem patentes e com código-fonte aberto. Como os demais formatos de compressão sem perdas, produz arquivos extensos e, na verdade, não é tão eficiente quanto os outros formatos sem perdas. Para alguns usuários, o facto de o código-fonte ser aberto é mais restritivo que quaisquer deficiências que o formato FLAC possa ter. E, graças a isso, a sua aceitação no mercado tem crescido bastante e, curiosamente, ao contrário do formato Vorbis, vários dispositivos electrónicos de áudio suportam-no.

– IFF (Interchange File Format)
O formato IFF foi criado pela Electronic Arts que desobstruiu a documentação para o mesmo, bem como o código-fonte em linguagem C, para ler e escrever arquivos do tipo IFF. Assim, tornou simples para os programadores escreverem formatos de arquivos “extensíveis” e “retro compatíveis”. Este formato ajuda a minimizar problemas como as actualizações e novas versões de um qualquer programa que tem problemas em ler dados produzidos por versões mais antigas.

– CODEC sem compressão e com compressão


CODEC é o acrónimo de Codificador/Descodificador, dispositivo de hardware ou software que codifica/descodifica sinais.

Os CODEC sem compressão são aqueles que codificam som ou imagem para comprimir o arquivo sem alterar o seu respectivo original. Se o arquivo for descomprimido, o novo arquivo será idêntico ao original. Este tipo de CODEC normalmente gera arquivos codificados que são entre 2 a 3 vezes menores que os arquivos originais. São muito utilizados em rádios e emissoras de televisão para manter a qualidade do som ou imagem.

Os CODEC com compressão são aqueles que codificam som ou imagem, gerando uma certa perda de qualidade exactamente por se querer alcançar um resultado com maiores taxas de compressão. Essa perda de qualidade é librada com a taxa de compressão para que não sejam criados artefactos perceptíveis. Por exemplo, se um instrumento muito baixo toca ao mesmo tempo que outro instrumento mais alto, o primeiro é suprimido, já que dificilmente será ouvido. Nesse caso, somente um ouvido bem treinado pode identificar que o instrumento foi suprimido.

Os CODEC com perdas foram ainda criados para comprimir os arquivos de som ou imagem a taxas de compressão muito altas. Por exemplo, no formato de áudio Vorbis e no formato de áudio Mp3, os codec para som facilmente comprimem os arquivos sem gerar artefactos significativos.

– Tipos de som: ruído, fala, música e silêncio


O som é uma vibração do ar, isto é, uma sequência de sobrepressões e depressões do ar em relação à pressão atmosférica.

Os factores mais importantes que afectam a propagação do som são: o tipo da fonte, a distância da fonte, a absorção atmosférica, o vento, a temperatura, os obstáculos, tais como barreiras e edifícios, a absorção do solo, as reflexões e a humidade.

Tal como a música, o ruído, a fala e até mesmo o silêncio são tipos de som.

Este último, o silêncio, pode provocar alguns equívocos quanto à sua qualificação ou não como tipo de som mas essa afirmação pode ser explicada da seguinte forma: o silêncio é, teoricamente, o nome atribuído à ausência de som, mas o som é apenas a vibração do ar perceptível ao ouvido humano. Há animais que prevêem atempadamente maremotos, por exemplo, porque conseguem ouvir sons a quilómetros de distância e isso, normalmente, desencadeia certos comportamentos que não são típicos neles. Outro exemplo, ainda, pode ser a batida do coração ou os sons que o organismo provoca. Por menos barulho que o ser humano tente fazer, mesmo que fique calado, há sempre esse ruído presente. Por isso mesmo, o som existe até na qualidade de silêncio. O silêncio pode, então, ser considerado como prova da existência da Vida.

O ruído é um tipo de som que está presente em todo o lado: a ventilação, o arrastar de objectos, o andar de um veículo, a chuva a cair, o barulho produzido pelos dentes quando comemos algo, o caminhar das pessoas, e tantas outras coisas inerentes à vida. Há algumas espécies de ruído: o ruído contínuo (produzido, por exemplo, por máquinas que funcionam sem interrupção), o ruído intermitente (por exemplo, quando máquinas operam em ciclos ou quando algum veículo passa por nós, o nível de som aumenta e diminui rapidamente) e o ruído impulsivo (é breve e abrupto, como por exemplo, as explosões ou impactos). O ruído pode, ainda, ter algumas fontes, tais como: o ruído ambiente (é o ruído provocado por todas as fontes juntas – ruído da fábrica, do tráfego, dos pássaros, da água, por exemplo), o ruído específico (é o ruído da fonte que se pretende medir ou investigar) e o ruído residual / ruído de fundo (este ruído é composto pelos elementos do ruído ambiente que não são ruídos específicos; é perceptível quando o ruído específico é suprimido).

A fala é um dos meios de comunicação mais primitivos do mundo. Para falar ou cantar são movimentados cerca de uma dúzia de músculos da laringe. O ar que sai dos pulmões percorre os brônquios e a traqueia e, chegando à laringe, os músculos contraem-se, regulando a passagem do ar. Os movimentos do ser humano fazem as cordas vocais vibrarem e produzirem sons. Chegando à boca, o som da laringe é articulado graças à acção da língua, dos lábios, dos dentes, do véu palatino e do céu-da-boca.

A música é uma forma de arte que se constitui basicamente em combinar sons e silêncio seguindo, ou não, uma pré-organização ao longo do tempo, é um dos sons mais agradáveis de ouvir, dependendo, obviamente, dos gostos e preferências de cada pessoa. Os géneros musicais vão desde a música tradicional/regional até à música electrónica.

– Composição Áudio e Sonoplastia


 

 

 

 

 

 

 

Sonoplastia é a comunicação pelo som. Abrangendo todas as formas sonoras – música, ruídos e fala, e recorrendo à manipulação de registos de som, a sonoplastia estabelece uma linguagem através de signos e significados.

Sonoplastia (do Lat. sono, som + Gr. plastós, modelado) é um termo exclusivo da língua portuguesa que surge na década de 60 com o teatro radiofónico, como a reconstituição artificial dos efeitos sonoros que acompanham a acção. Esta definição é extensiva ao teatro, cinema, rádio, televisão e web. Antes designada como composição radiofónica, tinha por função a recriação de sons da natureza, de animais e objectos, de acções e movimentos, elementos que em teatro radiofónico têm que ser ilustrados ou aludidos sonoramente. Incluía ainda a gravação e montagem de diálogos e a selecção, a gravação e alinhamento de música com uma função dramatúrgica na acção ou narração. O sonoplasta, auxiliado por um contra-regra que produzia efeitos sonoros em directo (foley effects / bruitage), tais como a abertura de uma porta à chave e o consequente fechamento, passos caminhando em pisos de diferentes superfícies, ou o galope de um cavalo efectuado com casca de coco percutida, ou ainda auxiliado por um operador de som que manipulava os discos de efeitos sonoros de 78 RPM, controlava a mistura dos vários elementos sonoros com a voz gravada.

A sua posterior associação à televisão e ao cinema documental toma subtis variações e formas, recorrendo, assim, com maior incidência na selecção de músicas para o acompanhamento de sequências de imagem, ou como música de fundo de uma narração.

Todo o som utilizado numa construção sonora audiovisual tem o objectivo de ilustrar/destacar movimentos ou acções que ocorrem na sequência de uma cena, diálogo, locução, etc. A montagem do áudio na sonoplastia pode conter elementos que reforcem a naturalidade do que está a ocorrer, ou fazer com que o receptor tenha uma percepção diferente do que seria o som natural daquela acção.

Para a realização de criações sonoras, podemos classificar os efeitos sonoros em dois tipos:

Efeitos editoriais – São eventos sonoros que não exigem grande complexidade de obtenção e manipulação, por exemplo: ruídos de computador, buzinas, assobios, etc.

Efeitos principais – São eventos sonoros que necessitam um trabalho de produção e pesquisa mais elaborados. Muitas vezes a criação daquele som demanda um grande tempo para ser alcançada e demanda um grande esforço criativo do sonoplasta. Por exemplo: som de uma nave espacial que percorre velocidades enormes, sons de animais extintos, etc.

Análise e estudo de um caso-exemplo


Para a análise e estudo de um caso-exemplo escolhi uma das músicas que construí para a disciplina, trabalho prático proposto pelo professor.

 

 

“My old guitar” é um tema inédito meu, todo ele construído com samples gravados, samples pesquisados e samples do próprio programa que usei para construir as músicas, o Mixcraft 4/5. É um tema de carácter “simpático” e bem-disposto onde se podem ouvir, basicamente, vários acordes de guitarra. Inspirei-me em países com temperamento quente onde o sol brilha com intensidade e as pessoas gostam de conversar e unirem-se para fazer música, cantando e tocando instrumentos. Com os vários acordes diferentes de guitarra pretendo fazer uma alusão a cada música cantada por essas mesmas pessoas, como se fosse uma colectânea de músicas numa só música. Este tema é, basicamente, uma recordação desses velhos tempos.