dados da pesquisa do fundo do mar australianos, com imagens e anotações de especialistas

Georreferenciamento

Este conjunto de dados bentônica australiano (BENTHOZ-2015) consiste em um conjunto anotado-especialista de imagens bentônicos georreferenciados e dados de sensores associados, capturado por um veículo submarino autônomo (AUV) ao redor da Austrália. Este tipo de dados é de interesse para os cientistas que estudam marinhas bentônicas habitats e organismos. AUVs recolher imagens georreferenciadas sobre uma área com iluminação consistente e altitude, e torná-lo possível gerar larga escala, foto-realistas mapas 3D.cientistas marinhos, em seguida, normalmente gastam vários minutos em cada um dos milhares de imagens, rotulagem tipo de substrato e biota em um subconjunto de pontos. Etiquetas de quatro grupos de pesquisa australianos foram combinados usando o esquema de classificação CATAMI, um esquema de classificação hierárquica baseada em taxonomia e morfologia por conseguir imagery marinha. Este conjunto de dados consiste de 407.968 especialista marcado pontos em torno da costa australiana, com imagens associadas, geolocalização e outros dados do sensor. melhores serviços de Georreferenciamento http://geodrones.com.br/produto/imagens-georreferenciadas/ Os levantamentos robóticos que colhidos este formulário de dados parte do Sistema de Observação da Austrália Marítima Integrada (IMOS) programa de monitoramento bentônica em curso. Há potencial reutilização em ciência marinha, robótica, e pesquisa de visão por computador.

Tipo (s) projeto
  • objectivo de integração de dados
  • design de séries temporais
  • curadoria digitais
Tipo (s) de medição
  • recurso marinhas bentônicas
Tipo (s) tecnologia
  • fotografia georreferenciada
Tipo (s) fator
Característica (s) Amostra
  • Houtman Abrolhos
  • Estado da Tasmânia
  • Rottnest Island
  • Western Australia
  • Ilhas solitários
  • Nova Gales do Sul
  • South East Queensland
  • bioma marinhas bentônicas

georreferenciamento

Antecedentes e Resumo

Menos do que 0,05% do piso global de mar tem sido mapeado com o mapeamento de sonar faixa 1 , a alta resolução (dezenas de metros).Cobertura em resolução Visual (milímetros), utilizando uma câmera é substancialmente menor. Visual resolução permite a análise detalhada da taxonomia bentônica; no entanto, isso requer a captura de imagem a uma altitude de vários metros acima do fundo do mar, normalmente viajando mais lento do que andando ritmo. A crescente maturidade da AUVs tem permitido mais amplas e sistemáticas pesquisas visuais do que o mergulhador tradicional realizado câmeras ou trenós de vídeo rebocados (um sistema em que uma câmera em um trenó subaquático é anexado a um navio por um cabo, e rebocado. As imagens resultantes são de qualidade inferior do que um AUV como o posicionamento, particularmente altitude, é difícil de controlar com precisão). AUVs pode operar continuamente e com precisão em profundidades maiores, com geolocalização, dados de sensores e imagens estéreo capturado várias vezes por segundo. Um mapa 3D visual da área de pesquisa pode, então, ser produzidos a partir dos dados. Esta abundância de dados introduziu um novo problema para os cientistas: eficiência extraindo e destilando informações úteis a partir dos dados brutos.

O conjunto de dados apresentada neste documento contém 407,968 anotações de especialistas de 9.874 imagens georreferenciadas com dados associados sensores (latitude, longitude, profundidade, altitude, salinidade e temperatura) em torno da costa australiana (ver Fig. 1 ). As anotações para conformar uma hierarquia 148 de substrato e biológicos classes ( Fig. 2 ), e especificar o conteúdo em pontos específicos dentro de cada imagem. Todos os dados de imagem e sensores foram capturados pelo Sirius AUV. Sirius é a plataforma principal responsável pela recolha de imagens do fundo do mar como parte da instalação AUV do Sistema de Observação Marinha Integrada (IMOS) da Austrália 2 .Tabela 1 resume o número de etiquetas de peritos aplicado a cada campanha, e Fig. 1 mostra a localização geográfica de cada implantação.O processo de anotação representa um gargalo significativo, tendo treinado marinho cientista 5 min ou mais para atribuir rótulos semânticos para dezenas de pontos individuais em uma única imagem usando o contexto fornecido pelo bairro de imagem em torno do ponto.Depois de uma pesquisa é realizada, normalmente há um intervalo de tempo de vários anos antes da rotulagem está completa, e inferências científicas pode começar a ser desenhado. Mesmo com este atraso, só é prático para rotular uma fração muito pequena dos dados recolhidos pela AUV. Para as implantações neste conjunto de dados, os 9.874 imagens com rótulos representam cerca de 2% do número total de imagens capturadas durante essas implementações.

Figura 2: CATAMI Hierarquia diagrama.

Os números entre parênteses indicam o número de pontos no conjunto de dados que foram rotulados como uma determinada classe, ou um de seus descendentes. CATAMI Hierarquia foi estendido para diminuir o nível de (espécie), onde os dados apropriada estava disponível. Melhor visualizado por via electrónica.

Tabela 1: Conjunto de dados resumo regional.

técnicas de aprendizado de máquina e de visão por computador têm o potencial de aumentar a quantidade de dados rotulados e reduzir o tempo que leva para fazê-lo. A disponibilidade de um conjunto de etiquetas de especialistas de alta qualidade com diversidade geográfica e temporal permitirá pesquisadores nesses campos para investigar maneiras de reduzir ou eliminar o esforço rotulagem manual, bem como o ganho de novos conhecimentos científicos de trabalhar com um conjunto de dados combinado. Outro obstáculo significativo para a análise integrada de dados de imagens bentônica é a falta de padronização entre os grupos de pesquisa. Até recentemente, os grupos de pesquisa individuais têm rotulado imagens usando uma variedade de sistemas de etiquetagem personalizada e padrões adequados para sua região e de pesquisa particulares interesses geográficos, o que limita a capacidade de executar a análise científica, ou de trem algoritmos de aprendizado de máquina em grandes conjuntos de dados variados.Neste conjunto de dados, no entanto, combinar dados de quatro grupos principais de pesquisa, usando as ferramentas de colaboração e automatizados recentemente estabelecidos para Análise da Marinha Imagery (CATAMI) hierarquia de classe 3 como um sistema de rotulagem normalizado. O esquema CATAMI permite que os diversos regimes fossem combinados de forma consistente e significativa, como mostrado na Fig. 2 .

Métodos

Recolha de Dados AUV

Este conjunto de dados inclui imagens anotados de uma extensa série de pesquisas bentônicos baseados em AUV que foram realizadas entre 2008 e 2013, em torno da costa da Austrália. Localizações geográficas incluem a Austrália Ocidental, Tasmânia, Nova Gales do Sul e Queensland ( Fig. 1 ). Os dados de imagem e sensores foram recolhidos pela AUV Sirius, como descrito na ref. 4 . As campanhas foram realizadas pela instalação AUV do programa IMOS, financiado pelo Governo da Commonwealth e agências colaboradoras (ver Agradecimentos). Durante cada campanha, Sirius executado várias missões, implantados em locais seleccionados pelo partido ciência, normalmente com foco em recifes rochosos temperadas e recifes de coral. Missões são definidos por um conjunto de pontos de interesse georreferenciados e instruções. O AUV capturado autonomamente imagens a cada 0,5 s, mantendo uma nominal de 2 m de altitude acima do fundo do mar.

A metodologia de amostragem geral é descrito na ref. 4 como sendo projetado para monitorar os processos de recife fundamentais que mantêm a biodiversidade recife e resiliência. Os processos de interesse ocorrer em um número de escalas espaciais, assim que um desenho amostral hierárquico aninhado foi adotado para permitir que as alterações a serem observados nas escalas diferentes. projetos de missão de implantação incluem: (1) transectos muito utilizado para monitorar a estrutura ampla comunidade e integridade, dos limites da comunidade, e as transições (2) larga escala, grades esparsas na ordem de 500-1.000 m de um lado para determinar a variabilidade espacial na estrutura do habitat (3) em pequena escala 25 m × 25 m redes densas de cobertura completa, fornecendo mapeamento de cobertura contígua para o estabelecimento de áreas de monitoramento de longo prazo.Mais detalhes sobre locais de destino habitat, padrões de pesquisa que se sobrepõem, e outros aspectos do design de pesquisa podem ser encontrados em ref. 4 . Implementações foram realizadas a partir de um navio e tipicamente durou algumas horas, resultando em dezenas de milhares de pares de imagens estéreo e dados de sensores associados por mergulho.

especialista Anotações

A abordagem geral para a anotação de imagens entre os quatro grupos de investigação foi o mesmo. Um subconjunto de imagens dos mergulhos foram selecionados (por exemplo, cada imagem 100º), eo pacote de software comumente usado Coral Point Contagem com as extensões do Excel (CPCE) 5 foi usado para rotular o conteúdo abaixo até 50 pontos uniformemente aleatoriamente selecionados dentro da imagem ( em que o rótulo representa o conteúdo sob esse ponto, em vez de uma área maior em torno dele). Deve notar-se que o conjunto de dados é, por conseguinte, inadequados para estimar a abundância das classes raras com base em imagens individuais; o uso pretendido é calcular estatísticas sobre um 25 m × 25 m ou maior área, ou ao longo de um transecto. Uma discussão mais aprofundada da literatura da ciência marinha, utilizando até 50 pontos por imagem podem ser encontrados na seção final deste descritor.

Para a finalidade deste conjunto de dados, os sistemas de rotulagem utilizados pelos grupos de investigação individuais foram mapeadas na hierarquia CATAMI 3 (ver Fig. 3 para um exemplo). Arquivos de mapeamento utilizados para converter códigos de CPC originais para aulas CATAMI foram revistos pelos respectivos grupos de ciências marinhas, e são incluídos como arquivos complementares ( dados de citação 1 : Figshare http://dx.doi.org/10.6084/m9.figshare.1524139 ) , juntamente com uma descrição de cada classe na hierarquia CATAMI (dados de citação 1 : Figsharehttp://dx.doi.org/10.6084/m9.figshare.1524139 ). As secções seguintes descrevem as diferenças de metodologia entre os grupos de pesquisa.

Austrália Ocidental

As imagens foram obtidas a partir de três locais-chave ao longo da costa da Austrália Ocidental; Rottnest Island, Jurien Bay e as Ilhas Houtman Abrolhos. Rocky habitat reef / coral foi alvo de estabelecer uma série de locais de referência para o acompanhamento a longo prazo na bioregion costa oeste. Sites foram selecionados com base em mapas batimétricos e conhecimentos já existentes, para direcionar moderada a reef alto relevo entre 15 e 30 m de profundidade. Dentro de cada local, 3 grades replicados foram pesquisados pela AUV que foi conseguido através da realização de uma série de paralelos, sobrepondo-se 25 m de comprimento transectos, cobrindo uma área total de 625 m 2 do fundo marinho (ou seja, 25 × 25 m). Replicar grades dentro de um site foram posicionados a cerca de 200 m de distância. Mais de 1.000 pares de imagens estéreo georreferenciada foram coletadas de cada grade. Estas imagens de alta resolução foram subsampled no s intervalos de 20 para gerar um conjunto de amostras de 101-129 imagens não sobrepostas que maximizaram cobertura espacial de cada grade 6 . Para análise de imagem, 50 pontos aleatórios digitalmente foram sobrepostos em cada amostra, e o número de pontos que cobrem cada categoria bentônica foi contado (usando CPCE 5 ), então dobrou para dar uma procuração de cobertura por cento. Quarenta categorias bentónicos, incluindo flora dominante, a fauna e as características do substrato, foram determinadas a priori com base em pesquisas anteriores 7 e usados para classificar cada imagem. Foi tomado cuidado para incluir espécies conspícuas de grande importância ecológica, como o marrom radiataalgas Ecklonia formação de copa e Scytothalia dorycarpa, ao mesmo tempo, utilizando grupos funcionais ou morfológicos para alcançar uma abordagem ampla e holística para descrever os bentos. Coral descorado foi considerado “vivo”, mas informações adicionais sobre a extensão espacial de qualquer branqueamento foi gravado.

Nova Gales do Sul

Imagens obtidas durante inquéritos AUV foram usadas para quantificar a estrutura da assembléia bentônica e composição em recifes rochosos em três locais ao longo da costa leste da NSW ( Fig. 1 ). Estes três locais incluídos altamente diversas recifes rochosos sub-tropicais e temperadas entre 20 e 50 m de profundidade 8 . Dentro de cada múltiplo de localização 625 m 2 redes densas de recife rochoso foram pesquisados em vários locais usando o Sirius AUV, os sites foram pelo menos 1 km de distância. O AUV alcançada a cobertura completa de cada grade de 625 m 2 densa (15.000 pares de imagens), do qual 50 imagens espacialmente equilibradas foram selecionados usando um design tessellated aleatória estratificada generalizada no pacote Rspsurvey 9 . Cada imagem cobria uma área de aproximadamente 1,8 m 2;assim, 50 imagens coberta 15% de uma grelha densa 6625 m 2. Vinte e cinco pontos aleatórios foram sobrepostas em cada imagem e taxa em cada ponto foram identificados para a maior resolução taxonômica possível usando CPCE. O esquema de classificação padrão nacional CATAMI Versão 1.2 foi utilizado para identificar organismos a um, morfo-grupo taxonómico (por exemplo coral incrustantes), principal grupo (classe) e / ou nível morfológico 3 .

Tasmânia

campanhas AUV realizadas em 2008 e 2009 alvo sistemas de recifes na Península Tasman na costa Sudeste da Tasmânia. transectos AUV seguiu um projeto da grade alongada onde a seção ‘long’ de transectos foi orientada para baixo o gradiente de profundidade e seções “curta” de transecto foram orientados em todo o gradiente de profundidade. Cada imagem 100 ao longo do caminho transecto (um espaçamento de cerca de 40 m) de uma câmera foi marcado usando CPCE. Em análises preliminares sobre a Península da Tasmânia, um espaçamento de 40 m significava que as imagens geralmente ocorreram no próximo patch de substrato ao longo do transecto ea gama de substratos e os valores das variáveis multifeixe derivado da amostra em imagens foi representante do que a encontrada em todo o região de estudo. O substrato ou na biota por baixo 50 pontos aleatórios dentro de uma imagem foi marcado. Bentos foi identificado com a unidade taxonômica ou morfológica possível menor usando refs 10 e 11 . Para a maioria dos invertebrados sésseis este foi morfoespécie, identificado pela morfologia e cor. algas representativos foram identificadas as espécies, caso contrário a grupos funcionais, e invertebrados móveis (observada com frequência) foram atribuídos a grandes categorias (por exemplo, estrelas do mar, ouriços-do-mar, moluscos). Esta abordagem de pontuação pré-lançamento do sistema de classificação CATAMI, e contém um número de classes altamente específicas (a nível da espécie). Para o propósito deste conjunto de dados, rótulos foram mapeados post hoc para o regime, onde a classe marcou foi acompanhado ao mais profundo nível válido da hierarquia.

Queensland

A campanha AUV realizado em Queensland em 2010 focada em sistemas de recifes leste de Moreton Island no sudeste de Queensland. A missão AUV destinava-se a cobrir a gama profundidade total do recife no Sul de Henderson, que foi de aproximadamente 12 m de profundidade na sua mais raso para mais de 45 m, na sua maior profundidade. A gradação na tipos de habitats foi conhecido para ocorrer neste local, a transição de algas relva e corais nas partes mais rasas do recife para kelp florestal nas áreas mais profundas. Por isso, o sub-amostragem regular foi realizado, permitindo o mapeamento das características espaciais da estrutura do habitat. Transectos foram localizado entre as profundidades de 17-42 m em um projeto da grade de 400 × 500 m retangular com linhas que se cruzam espaçados a cada 100 m. A grade foi orientada de modo que havia cinco linhas de aproximadamente EW perpendiculares para contornos de profundidade e seis NS aproximadamente paralelo aos contornos de profundidade. A partir de cada uma destas linhas 100 m transectos foram sub-amostrado, ao longo do lado de cada uma das células descritas pela grade quadrada.Dez imagens foram selecionados a partir de cada corte transversal com um espaçamento de 10 m. O substrato ou na biota por baixo 20 pontos aleatórios dentro de uma imagem foi marcado usando CPCE. Bentônica biota foram identificados para a unidade taxonômica ou morfológica possível menor usando o esquema de classificação CATAMI. Para a maioria dos invertebrados sésseis este foi morfoespécie, diferenciadas pela morfologia e cor. algas representativos foram identificadas as espécies, caso contrário a grupos funcionais, e invertebrados móveis (observada com frequência) foram atribuídos a grandes categorias (por exemplo, estrelas do mar, ouriços-do-mar, moluscos).

disponibilidade do código

A produção e processamento destes dados se baseava em um gasoduto software complexa, envolvendo controlar um AUV pairar-cabo, extrair e pós-processamento dos dados para produzir georreferenciamento preciso através de uma simultânea Localização e Mapeamento algoritmo (SLAM), usando CPCE para anotar imagens, e outros scripts para importar dados para o Squidle aplicação web imagery bentônica. O código para Squidle, juntamente com os scripts de importação, estão disponíveis no github no http://github.com/acfrmarine/squidle . O script usado para importar os arquivos de CPC na base de dados squidle está localizado na esse repositório de scripts / anotação-scripts / import_cpc_file.py. As descrições mais completas do processo de aquisição de dados estão em ref. 12 para processamento de imagem, e ref. 13 para navegação e SLAM.

registros de dados

O conjunto de dados completo aqui descrita foi disponibilizado noSquidle em http://squidle.acfr.usyd.edu.au . Squidle é um novo quadro baseado na web que facilita a exploração, gestão e anotação de imagens marinho. Ele fornece uma interface fácil de usar que integra ferramentas de gerenciamento de dados baseados em mapas geográficos com um sistema de anotação avançado. O sistema de anotação on-line permite que os cientistas a colaborar facilmente em ambos os rotulagem e utilização dos seus dados. Ele irá, no futuro, também fornecem uma plataforma para a utilização e teste de aprendizado de máquina e de visão computacional algoritmos em imagens de marinha. Este conjunto de dados foi disponibilizado para ver, explorar e baixar através da interface web. A maioria das anotações de especialistas foram produzidas antes do desenvolvimento de Squidleeo esquema CATAMI, e foram importados para Squidle CPCE. Em comparação, CPCE é um aplicativo independente para usuários individuais para rotular imagens marinhos localmente, e não inclui recursos de nível mais alto, como a exploração de dados e colaboração online. Uma comparação entre Squidle, CPCE, e outras plataformas foi realizada na ref. 14 .