As melodias das canções, ambas tonais, são construídas sobre uma escala diatónica maior (Lá) mas têm um âmbito diferenciado: em Tum tum piscatum é mais alargado, uma oitava (Si2-Si3), e em Cai, cai balão é uma sexta (Lá2-Fá#3). Consideradas em conjunto, o âmbito é superior a uma oitava (Lá2-Si3).
Cada uma das canções é constituída por duas frases de igual duração, que se repetem. As melodias das duas canções, têm uma correspondência harmónica que lhes permite serem cantadas de forma sobreposta mantendo a harmonia sem dissonâncias. Por outro lado, contrastam ao nível do registo: Tum tum piscatum desenvolve-se mais no registo agudo da escala e Cai, cai, balão no mais grave.
Do ponto de vista da construção melódica, Tum tum piscatum apresenta uma melodia com vários tipos de intervalos, ao passo que em Cai, cai balão é quase exclusiva a movimentação por graus conjuntos.
Harmonicamente, as primeiras frases de cada uma das canções terminam na dominante (5º grau da escala) e ambas as canções concluem com frases a regressar à tónica (1º grau da escala).
A canção está escrita em compasso quaternário com divisão binária do tempo (4/4). Há um certo contraste entre a rapidez do ritmo melódico e um desenvolvimento harmónico mais espaçado.
Ambas as canções começam em anacruse (e na mesma nota, também), partilhando um começo comum, o que é reforçado quando se cantam em sobreposição.
Tum tum piscatum é composta por duas frases ritmicamente iguais e melodicamente diferentes. Cai, cai, balão tem duas frases diferenciadas a estes níveis, representando um acréscimo de diversidade quando se sobrepõem as canções.
Estamos perante uma forma musical em que duas melodias são cantadas em contraponto, de maneira a tornar-se naquilo que se designa por quodlibet (do latim, ‘o que agrada’), uma forma musical com antecedentes históricos que remontam ao séc. XV. No presente caso, é um quodlibet simultâneo.
Analisada separadamente, cada canção é constituída por duas frases melódicas distintas, que se repetem: |AB AB|
Quanto à estrutura do texto, coincide com a estrutura das frases melódicas, incluindo a sua repetição.
A sonoridade e os acompanhamentos rítmicos do arranjo transportam-nos para os ritmos e os sons do Brasil. O arranjo inclui uma Introdução, com uma entrada sucessiva de instrumentos, alguns deles característicos da música popular brasileira (berimbau, bandolim, acordeão e percussão, sustentados por um contrabaixo de cordas). À medida que a música se desenvolve, novos timbres e ritmos são adicionados e a textura adensa-se. Em contraste, a parte final da música retorna à simplicidade sonora inicial, com as vozes a terminarem acompanhadas apenas pelas percussões e pelo berimbau.
A nível da estrutura formal, após a apresentação de cada uma das canções em separado, incluindo repetição, o coro divide-se em duas metades e cada parte assume a apresentação completa das duas canções. Depois de uma entrada sucessiva, cada grupo apresenta as canções completas duas vezes, com uma nuance: o grupo que começou volta a repetir a estrofe inicial de modo a acompanhar até ao fim os que começaram mais tarde.
Esquematicamente, a estrutura geral do arranjo pode representar-se do seguinte modo:
Introd.| AB AB| CD CD| AB CD/AB| CD/AB CD/AB|
Tum tum piscatum,
gatá piscatum galaribé,
piscatum gatinga.
Aué bere bere, bé
piscatum galaribé,
piscatum gatinga.
Cai, cai balão,
cai, cai balão
na rua do sabão.
Não cai não, não cai não, não cai não,
cai aqui
na minha mão.