Dicas, Linux

Instalando o Oracle VirtualBox no RHEL 6.x

Recentemente precisei instalar o Oracle VirtualBox (um projeto anteriormente mantido pela Sun Microsystems) em um laptop rodando o RHEL 6.5 (x86_64).

Apesar da instalação do pacote ocorrer sem erro.

# sudo yum localinstall ~/Downloads/VirtualBox-4.3-4.3.12_93733_el6-1.x86_64.rpm

Tive algumas dificuldades devido a falta de alguns pacotes e configurações. Ao executar o VirtualBox pelo terminal pela primeira vez uma mensagem de erro é mostrada instruindo executar o seguinte comando:

# sudo /etc/init.d/vboxdrv setup

Mais erros ocorrem devido a falta de algumas dependências, entre elas, os headers e o código fonte do Kernel do Linux. Para sanar este problema instale os seguintes pacotes via YUM:

sudo yum install kernel-devel kernel-headers binutils glibc-headers glibc-devel gcc make patch dkms

em seguida defina a seguinte variável de ambiente

# export KERN_DIR=/usr/src/kernels/2.6.32-431.11.2.el6.x86_64 #a versão do kernel no seu ambiente pode ser diferente

por fim execute novamente o comando abaixo:

# sudo /etc/init.d/vboxdrv setup

Se tudo der certo após esses passos o VirtualBox deverá ser iniciado normalmente sem erros. Pronto, agora pode começar a criar suas VMs com o VirtualBox.

 

 

Anúncios
Dicas, Java, Middleware

Oracle Fusion Middleware: conceitos

Oracle Fusion Middleware (OFM) é uma família de produtos que compreende desde ferramentas de desenvolvimento para a plataforma Java Enterprise Edition (JavaEE), até  soluções para integração de sistemas, gerenciamento de identidade, colaboração e Business Intelligence (BI). O OFM é fornecido e mantido pela empresa Oracle e é composto por uma grande variedade de produtos que oferecem suporte ao desenvolvimento, implantação e gerenciamento de sistemas para a plataforma JavaEE.

De forma bem simplista podemos definir middleware como sendo o software responsável por conectar componentes de software ou aplicações corporativas. Em um sistema multicamadas (ex: três camadas: apresentação, lógica/negócio e dados) o Middleware atua na camada do meio hospedando os componentes com a lógica de negócio da aplicação. Outra função importate do Middleware é fornecer a infraestrutura necessária para o desenvolvimento de aplicações de negócio (business applications). Serviços tais como: acesso concorrente à recursos computacionais, controle transacional, mensageria, segurança, logging etc. Tudo isso é oferecido pelo Middleware de forma, pelo menos em tese, a deixar o desenvolvedor responsável apenas com o que diz respeito ao negócio da aplicação.

A imagem a seguir destaca alguns componentes do OFM em uma visão de divisão em três camadas.

Oracle Fusion Middleware Architecture

Não se preocupe com o significado de cada componente que aparece na imagem acima neste momento. Ao longo do post iremos comentar os principais deles.

Dada uma breve descrição sobre o OFM exponho neste post alguns conceitos importantes para aqueles que pretendem iniciar sua jornada pelo arcabouço de produtos que compõem o Middleware da Oracle.

Hoje em dia instalar um software não é tarefa complicada. Para obter o binário correto basta saber em qual plataforma (arquitetura de hardware e sistema operacional) de destino da instalação e realizar o download no site do fornecedor. Em seguida basta seguir o guia de instalação do produto. Entretanto, para alguns tipos de software, existem alguns aspectos importantes que devem ser observados para evitar problemas futuros. É o caso do Middleware. Uma solução de Middleware geralmente é composta por uma variedade de componentes desenvolvida sob uma arquitetura modular. Essa característica implica uma certa complexidade na gerência do software que vai desde a instalação, operação até a gerência do ambiente.

Middleware Component

O primeiro conceito diz respeito aos tipos de componentes utilizados no OFM. Existem dois tipos:

  • java component: componente composto por uma ou mais aplicações e recursos JavaEE impltantado (deployado) em um domínio do Oracle Weblogic Server. Exemplos:
    • Oracle SOA Suite
    • Oracle Webcenter Portal
    • Oracle Business Intelligence Enterprise Edition
  • system component: serviço (processo) gerenciado pelo Oracle Process Manager and Notification (OPMN) – gerenciador de processos com uma interface de linha de comando (CLI). Exemplos:
    • Oracle Http Server
    • Oracle Web Cache
    • Oracle Internet Directory
    • Oracle Forms
    • Oracle Reports
    • Oracle Business Intelligence

Todo produto da linha OFM é executado sobre um mesmo componente de middleware: o Weblogic Server (WLS). Esta é a “runtime” (não confundir com a Java Virtual Machine – JVM sobre a qual roda o Weblogic) de todo o middleware Oracle. Em praticamente toda a instalação de um produto OFM você encontrará uma estrutura de diretórios contendo os binários do Weblogic.

Após instalar o OFM teremos um ambiente composto por, pelo menos:

  • Um Oracle Weblogic Server Domain, que nada mais é que um conjunto de instâncias de servidores conhecido como Managed Servers, sendo que um deles é utilizado para administração dos demais – o Administration Console. Os managed servers hospedam as aplicações e recursos (java component) JavaEE (EJBs, Data Sources, JMS Destinations, etc).
  • Um ou mais Oracle Instance (system component).
  • Se o componente/produto do OFM (ex: Oracle Business Intelligence ou Oracle SOA Suite) necessitar de um banco de dados de metadados, um database será criado como metadata repository.

Dessa forma é muito importante se familiarizar com a estrutura de diretórios utilizada na instalação do WLS. A imagem abaixo esquematiza a estrutura criada para a instalação do produto Oracle SOA Suite.

Oracle Middleware Home

Middleware Home e Weblogic Home

O Middleware Home é o diretório raiz de qualquer componente/produto (java ou system component) do OFM. Logo abaixo encontra-se o Weblogic Server Home criado durante a instalação do Weblogic. O Weblogic Home hospeda o servidor de aplicação Weblogic.

Weblogic Server Home após a instalação do Weblogic

NOTA: um detalhe importante e que confunde bastante em alguns casos é: em um mesmo Host o diretório Middleware Home deve ser único para uma determinada release do OFM (ex: 11g ou 12c). Outro detalhe é que dentro do Middleware Home só pode haver um Weblogic Server Home. Dessa forma não é possível instalar duas versões diferentes do Weblogic dentro de uma mesma estrutura do Middleware Home. Quando for necessário instalar releases diferentes do OFM em um mesmo Host recomenda-se criar estrutura de diretórios diferentes para cada release (ex: Middleware11g e Middleware12c).

No mesmo nível do Weblogic Server Home encontram-se outros diretórios. Abaixo descrevemos cada um deles.

Oracle Home

Com exceção do Weblogic Server Home, que contém os binários do application server, cada produto OFM é instalado em seu próprio Oracle Home. Este diretório armazena os binários do produto. Dessa forma nenhum processo escreve nele. No diagrama abaixo os binários do Oracle SOA Suite foram instalados dentro do Oracle Home chamado oracle_soa1 (neste caso também referenciado como SOA Oracle Home). Para produtos do tipo java component um weblogic domain também é criado para hospeda a aplicação e recursos JavaEE que compõem o produto.

Oracle Home após a instalação do Oracle SOA Suite
Oracle Home após a instalação do Oracle SOA Suite

Domain Home

Um Weblogic Domain deve ser entendido como um grupo lógico de java components (neste contexto são aplicações e recursos JavaEE). Um domínio é composto por um Administration Server (geralmente referenciado como admin server) e geralmente possui um ou mais Managed Servers (também referenciados como instâncias do weblogic). As aplicações e recursos são implantadas e executadas dentro do(s) Managed Server(s). Na instalação padrão de um produto do OFM a estrutura de diretórios utilizada para hospedar um domínio do weblogic segue o digrama abaixo:

SOA Domain após a instalação do Oracle SOA Suite
SOA Domain após a instalação do Oracle SOA Suite

O domínio não necessariamente deve residir dentro do diretório User Projects na estrutura do Oracle Middleware Home. Observe que a estrutura utilizada para hospedar o domain está fora do Weblogic Home e pode, inclusive, residir fora do Middleware Home (ex: em um storage remoto utilizando um protocolo NFS ou SAN). O diagrama abaixo destaca o domain criado para o Oracle SOA Suite.

É muito comum a instalação de vários produtos OFM em um mesmo ambiente/host. Dessa forma cada produto pode utilizar seu próprio domínio weblogic. O diagrama abaixo destaca dois domains distintos: um para hospedar o Oracle WebCenter e outro para o Oracle SOA Suite. Observe também dois Oracle Homes distintos, um para cada produto OFM.

Estrutura de Weblogic Domains para múltiplos produtos OFM instalados em um mesmo ambiente Oracle Middleware.
Estrutura de Weblogic Domains para múltiplos produtos OFM instalados em um mesmo ambiente Oracle Middleware.

NOTA: todos os produtos instalados dentro de uma estrutura Oracle Middleware Home devem ser compatíveis com a mesma release do OFM utilizada no ambiente em questão. Por exemplo, não seria possível instalar o Oracle WebCenter 12c em um ambiente preparado para o OFM 11g.

Outro aspecto interessante relacionado ao Weblogic Domain é possibilidade de extender (escalar) determinado domínio existente dentro de um host. Durante a criação ou configuração de um domain é possível adicionar novos managed servers, seja para extender um produto ou reutilizar um mesmo domínio. Por exemplo, ao invés de criar um novo domínio para instalar o Oracle WebCenter, poderíamos utilizar o mesmo domain criado para o Oracle SOA Suite. Nesse caso a estrutura de diretórios do OFM em nosso ambiente ficaria conforme a imagem abaixo:

Domínio extendido
Domínio extendido

Oracle Instance

Diferentemente dos diretórios descritos nos tópicos anteriores um diretório Oracle Instance hospeda system components, ou seja, serviços/processos não JavaEE tais como: Oracle Http Server, Oracle Web Cache ou Oracle Internet Directory.

Diferentemente do Oracle Home um diretório Oracle Instance contém arquivos passíveis de alteração (configuração, logs e temporários gerados durante a execução do processo/serviço). Assim como o diretório Weblogic Domain um Oracle Instance pode residir fora da estrutura do Oracle Middleware. O diagrama abaixo destaca um ambiente OFM contendo dois produtos instalados: um system component (WebTier composto por Oracle Http Server e Oracle WebCache) e um java component (Oracle SOA Suite), este último reside em um Weblogic Domain:

OFM com Webtier (system component) e SOA Suite (java compoenent - Weblogic Domain)
OFM com Webtier (system component) e SOA Suite (java compoenent – Weblogic Domain)

Oracle Common Home

Este diretório não está associado à um componente ou produto específico dentro da estrutura Oracle Middleware Home. Ele contém uma variedade de utilitários e bibliotecas utilizadas e necessárias pela solução de gerenciamento e monitoramento do OFM conhecida como Oracle (Enterprise Manager) Fusion Middleware Control e também pelo conjunto de bibliotecas, não incluídas por padrão no Weblogic, Java Required Files (JRF).

NOTA: dentro da estrutura Middleware Home só pode haver um único diretório Oracle Common.

O diagrama abaixo destaca o diretório Oracle Common Home:

Oracle Common Directory
Oracle Common Directory

Oracle Metadata Repository

Alguns produtos do OFM, tais como o Oracle BPEL Process Manager, Oracle Business Activity Monitoring, Oracle Business Intelligence necessitam de um Banco de Dados específicos para armazenar metadados do produto. Um Metadata Repository pode ser de dois tipos: baseado em banco de dados (database-based) ou baseado em um sistema de arquivos (filesystem-based). Embora os dois tipos sejam suportados a Oracle recomenda a utilização de repositórios baseados em Banco de Dados para o ambiente de produção.

Para esses produtos que necessitam de um repositório de metadados é necessário executar o passo de criação do repositório antes de prosseguir com a instalação do produto. Para isso é utilizada uma ferramenta específica: o Repository Creation Utility (RCU). Essa ferramenta cria os schemas de Banco de Dados necessários para o funcionamento do produto.

O diagrama abaixo destaca o Metadata Repository utilizado pelo produto Oracle SOA Suite:

Oracle SOA Suite's metadata repository
Oracle SOA Suite’s metadata repository

Espero com este post ter esclarecido alguns conceitos, geralmente ignorados ou confundidos, durante a instalação ou preparação de um ambiente de execução do Oracle Fusion Middleware. A fonte de referência para os conceitos aqui expostos é a excelente documentação oficial do produto disponível no siste da Oracle.

Nos próximos posts pretendo continuar explorando alguns conceitos específicos do Oracle Weblogic Server.

Abraço 😉

Curiosidades, Dicas, Java

Onde obter versões antigas do Java (JDK e JRE)

A plataforma Java é uma tecnologia bastante madura e bem antiga. De acordo com a página Java Version History no Wikipedia a primeira release (1.0) do Java Development Kit (JDK) data de Janeiro de 1996. Com uma trajetória tão longa e com sucesso comprovado no mercado corporativo não é raro nos depararmos com projetos em plena execução em versões antigas dessa plataforma.

“Volta e meia” precisamos baixar uma versão antiga da JVM para realizar testes ou preparar um ambiente semelhante ao atual ambiente de execução do projeto. Mas, onde podemos obter versões oficiais e específicas do Java (JVM, JRE, bibliotecas, etc)? As versões mais antigas eram mantidas pelo “falecida” Sun Microsystems. Bem, existe uma página que faço questão de manter em meus Favoritos. Trata-se da página “Oracle Java Archive“. Nela é possível obter todas as versões antigas da plataforma Java Standard/Enterprise Edition, inclusive bibliotecas depreciadas.

oraclejavaarchive

Ninguém gosta de lidar com velharia. Mas pra quem lida com consultoria em plataformas “maduras” como o Java isso é quase inevitável.

Abraço.

Dicas

Root login no Oracle Solaris 11

Recentemente criei uma máquina virtual x86 para rodar o Oracle Solaris 11 usando o VirtualBox. A ideia é utilizar essa VM como ambiente de prova de conceito para produtos da linha Oracle Fusion Middleware. Como todo sistema Unix-like o Solaris possui algumas restrições de segurança que impossibilita o acesso de root via SSH. Minha primeira tentativa foi editar a configuração do serviço sshd e habilitar a flag ‘PermitRootLogin’. Entretanto, isso não basta para que o login de root funcione no Solaris.

Após algumas “googladas” descobri que é necessário realizar os seguintes ajustes na configuração do S.O:

  • Habilitar o login de root no serviço sshd. Edite o arquivo /etc/ssh/sshd_config
# Are root logins permitted using sshd.
# Note that sshd uses pam_authenticate(3PAM) so the root (or any other) user
# maybe denied access by a PAM module regardless of this setting.
# Valid options are yes, without-password, no.
PermitRootLogin yes
  • Comentar a propriedade ‘CONSOLE’ no arquivo /etc/default/login
# If CONSOLE is set, root can only login on that device.
# If the specified device is /dev/console, then root can also log into
# any of the currently enabled /dev/vt/# virtual terminal devices.
# Comment this line out to allow remote login by root.
#
#CONSOLE=/dev/console
  • Editar a configuração do módulo PAM. Edite o arquivo /etc/pam.conf

Adicione a seguinte linha no fim do arquivo:

sshd-kbdint   account   required   pam_unix_account.so.1

Adicionado em 18/01/2013.

  • Para permitir o login de root pela console/shell da própria máquina é necessário alterar a role na qual o root está associado. Execute o seguinte comando como root.
root@solaris11:~# rolemod -K type=normal root
Found user in files repository.
UX: rolemod: root is currently logged in, some changes may not take effect until next login.

Agora tente executar o login como root pela console da máquina/VM (sem ser via ssh).

obs: obviamente, por questões de segurança, essa configuração não é interessante em ambiente de produção.

😉

Dicas

Bash Script: substituindo um texto em vários arquivos

Neste post quero compartilhar um bash script que criei para um necessidade bastante comum em ambientes Unix Like.

Necessidade:

“alterar um texto em vários arquivos de uma única vez”

Situação hipotética:

“vários arquivos texto (xml, properties, txt etc) espalhados dentro de um diretório raiz contendo um determinado termo (palavra, path de arquivo, propriedade etc)”

Esse tipo de situação é bastante comum no dia a dia de um administrador de sistemas e servidores. A abordagem da utilização de um script para automatizar esse tipode tarefa é bastante utilizada em ambientes baseados em Unix que possuam um shell com suporte a qualquer linguagem de script (bash, ksh, python, ruby etc).

No meu caso implementei um script bash para execução em sistemas Linux. Minha necessidade inicial foi alterar o caminho da instalação do Oracle Weblogic Application Server – WLS. A instalação do WLS escreve o caminho do diretório raiz da instalação em vários arquivos de configuração (arquivos .properties e .xml) e scripts de gerenciamento (arquivos .sh) espalhados por toda a sua estrutura de diretórios. Caso seja necessário alterar o caminho raiz da instalação do WLS, você tem duas alternativas: 1) instalar novamente o WLS; 2) alterar o path da instalação em todos os arquivos de configuração.

No meu caso meu WLS foi instalado em ‘/opt/Oracle/Middleware‘, porém precisei mudar o caminho raiz para ‘/opt/Oracle/Middlware11g.

Pois bem, meu scritpt recebe como entrada os seguintes parâmetros:

  1. path: diretório raiz onde os arqivos se encontram
  2. file pattern name: nome do arquivo a ser alterado (geralmente um coringa ‘*.’)
  3. old text: texto a ser alterado
  4. new text: novo texto

Quando executar o script sem parâmetros um pequeno help será exibido sugerindo um exemplo de uso.

# ~/replaceText.sh
invalid call!
 usage: ./replaceText <path> <file pattern name> <old text> <new text>
NOTES:
 1) don't use the pattern '*', instead specify a file extension (eg: '*.sh', '*.txt', '*.properties', '*.xml')
 2) for text containing special chars you have to scape them with '\'
eg: ./replaceText "/opt/Oracle/Middleware" "*.xml" "Oracle\/Middleware\/" "Oracle\/Middleware11g\/"

Ao executar o script com todos os parâmetros o diretório raiz (primeiro argumento) será percorrido e, para cada arquivo encontrado (obedecendo o padrão informado no segundo argumento), será necessário confirmar a alteração.

# ~/replaceText.sh /opt/Oracle/Middleware/ "*.properties" "Oracle\/Middleware\/" "Oracle\/Middleware11g\/"
 alterar o arquivo: /opt/Oracle/Middleware/user_projects/domains/cluster-replicated-domain/init-info/tokenValue.properties
 deseja continuar? ([S]im/[n]ao/[t]odos) S
 substituir [Oracle\/Middleware\/] por [Oracle\/Middleware11g\/]
 diff /opt/Oracle/Middleware/user_projects/domains/cluster-replicated-domain/init-info/tokenValue.properties /opt/Oracle/Middleware/user_projects/domains/cluster-replicated-domain/init-info/tokenValue.properties.BAK
 ----------------------------------------
 21c21
 < @DOMAIN_HOME=/opt/Oracle/Middleware11g/user_projects/domains/cluster-replicated-domain
 ---
 > @DOMAIN_HOME=/opt/Oracle/Middleware/user_projects/domains/cluster-replicated-domain
 24c24
 < @USERDOMAIN_HOME=/opt/Oracle/Middleware11g/user_projects/domains/cluster-replicated-domain
 ---
 > @USERDOMAIN_HOME=/opt/Oracle/Middleware/user_projects/domains/cluster-replicated-domain
 ----------------------------------------

No exemplo acima alterei todos os arquivos de propriedades (*.properties). Observe que existe a opção de alterar todos os arquivos encontrados de uma única vez. Basta selecionar a opção [a]ll quando for solicitada a confirmação. Observe também que o script faz um backup de todos os arquivos alterados (.BAK).

Ok. Após todo esse bla bla bla o código do script:

#!/bin/bash

DIR_PATH=$1
FILE_SEARCH_PATTERN=$2
OLD_STRING=$3
NEW_STRING=$4

LAST_REPLY="S"

askToContinue(){
   if [[ ! $LAST_REPLY =~ ^[Aa]$  ]]
   then
      read -p "continue? ([Y]es/[n]o/[A]ll) " -n1
      echo

      LAST_REPLY=$REPLY
      if [[ ! $REPLY =~ ^[Yy]$ ]]
      then
         continue
      fi
   fi
}

usage(){
   echo
   echo -e "\r invalid call!"
   echo -e "   usage: ./replaceText    "
   echo
   echo -e "\r NOTES:"
   echo -e "\r\t 1) don't use the pattern '*', instead specify a file extension (eg: '*.sh', '*.txt', '*.properties', '*.xml')"
   echo -e "\r\t 2) for text containing special chars you have to scape them with '\'"
   echo
   echo -e "   eg: ./replaceText \"/opt/Oracle/Middleware\" \"*.xml\" \"Oracle\\/Middleware\\/\" \"Oracle\\/Middleware11g\\/\""
   echo
   exit
}

[[ ! "$#" = "4" ]] && usage

for file_name in `find "$DIR_PATH" -type f -name "$FILE_SEARCH_PATTERN"`
do
  #Testa se o arquivo contem o texto a ser substituido
  file $file_name | grep -i "text" > /dev/null
  [[ "$?" -eq "1"  ]] && continue
  grep $OLD_STRING $file_name > /dev/null
  [[ "$?" -eq "1"  ]] && continue

  echo -e "\r\r\r changes the file: $file_name \r"
  askToContinue

  echo -e "\t replace [$OLD_STRING] by [$NEW_STRING] \r"

  if [ -d $DIR_PATH  ];
  then
     sed -i.BAK -e "s/${OLD_STRING}/${NEW_STRING}/g" $file_name

     echo -e "\t\t diff $file_name $file_name.BAK"
     echo -e "\r ----------------------------------------"
     diff $file_name $file_name.BAK
     echo -e "\r ----------------------------------------"
  else
     echo -e "\r $PATH_DIR does not exists!"
     exit
  fi

done

Eu usei o script sem problemas em um Linux Fedora (Linux Red Hat based). Mas creio que funcionará sem grandes problemas em qualquer Unix com um shell Bash.

Abraço 😉

Dicas, Java, JVM, Tools

Colhendo envidências em caso de erro (crash) na JVM

Sabe aquela situação em que a equipe responsável pelo ambiente de produção chega pra você e diz: “o servidor X está caindo toda hora… já olhamos os recursos da máquina (rede, memória, cpu e disco), inclusive o log do servidor, mas não identificamos nada…”

Isso mesmo! Há casos em que seu processo caiu sem dar explicações e sem deixar pista alguma.

Já tive a oportunidade de passar por essa situação algumas vezes… Trata-se de uma situação complicada, pois quase sempre ocorre em um momento e ambiente crítico onde o tempo para solução é o seu pior inimigo. Bem, após bater cabeça com esse tipo de problema, posso afirmar que a melhor opção é preparar o seu ambiente para colher algumas evidências quando o problema voltar a ocorrer. Como quase tudo na TI esse tipo de situação é inevitável. Softwares e Hardware podem falhar por “n” motivos. Nesse post deixo algumas dicas que podem lhe ajudar na investigação “pós queda” de um processo Java (rodando em cima de uma JVM).

Existem dois casos em que é bastante comum o processo da JVM cair:

  1. insuficiência de memória
  2. algum erro fatal da jvm

O tipo de erro relacionado à insuficiência de memória é o conhecido por OutOfMemoryError (OOM) e ocorre devido à algum memory leak no código da aplicação. Para analisar a causa desse tipo de erro é interessante ter em mãos o estado (snapshot) do Heap da JVM no momento em que o erro ocorre. Para isso é necessário habilitar alguns parâmetros na JVM conforme abaixo:

Geração do Dump (formato hprof) do Heap da JVM.

Adicionar as seguintes propriedades no comando que inicia a JVM. Caso o comando seja parametrizado em um arquivo de configuração, basta usar uma variável JAVA_OPTS como no exemplo abaixo.

# HeapDUMP e Core DUMP
# registra a data e hora de início do processo
DATE_START=`date  +%d-%m-%Y-%k%M`

# Habilita a geração do DUMP de memória (HPROF)
JAVA_OPTS="$JAVA_OPTS -XX:+HeapDumpOnOutOfMemoryError "
JAVA_OPTS="$JAVA_OPTS -XX:OnOutOfMemoryError=<execute algum comando shell aqui (ex: 'kill -9%p')> "
JAVA_OPTS="$JAVA_OPTS -XX:HeapDumpPath=/var/log/jvm/heapdump_$DATE_START.hprof "

 

NOTA:

  • Recentemente encontrei uma implementação alternativa à opção ‘-XX:OnOutOfMemoryError’ interessante. Vale a pena testar!
  • o arquivo de dump no formato .hprof pode ser aberto com os utilizatários jVisualvm (fornecido pelo JDK Sun/Oracle Hotspot) ou Eclipse Memory Analizer (MAT). É necessário que a versão e arquitetura do JDK utilizado na análise dump seja idêntica à JVM utilizada pelo servidor de aplicação onde o erro ocorreu.

O segundo caso de erro pode ser gerado por algum problema entre a JVM e SO. Um caso típico é o erro de estouro de pilha conhecido como StackOverflowError. Esse tipo de erro pode ocorrer caso a aplicação utilize algum tipo de loop infinito ou uma recursividade muito profunda. O tamanho da pilha alocada pela JVM durante a criação de uma thread java é de 1024KB (1mb) em um sistema Linux x64. É possível alterar esse valor para mais ou para menos a depender da necessidade da aplicação. O parâmetro da JVM -Xss:<n>k altera o valor da pilha, sendo que <n> é um valor inteiro.

Geração do coredump (threads e memória) da JVM

Adicionar as seguintes propriedades no comando que inicia a JVM.

# Habilita a geração de coredump (BIN)
JAVA_OPTS="$JAVA_OPTS -XX:OnError='gcore -o /var/log/jvm/jboss_PID%p_$DATE_START.coredump %p' "
JAVA_OPTS="$JAVA_OPTS -XX:ErrorFile=/var/log/jvm/hs_err_jboss_PID%p_$DATE_START.log "

NOTAS:

  • A opção ‘-XX:OnError‘ é executada apenas quando  a causa raiz do erro for Nativo devido a alguma falha fora da JVM – JVM Native Crash.
  • o arquivo de dump no formato hprof pode ser aberto com os utilizatários jVisualvm (fornecido pelo JDK) ou Eclipse Memory Analizer (MAT).  É necessário que a versão e arquitetura do JDK utilizado na análise dump seja idêntica à JVM utilizada pelo servidor de aplicação onde o erro ocorreu.
  • Para que o comando gcore (invocado pela JVM após o evento de erro) funcione é necessário que o pacote gdb (A GNU source-level debugger for C, C++, Fortran and other languages) esteja devidamente instalado no Sistema Operacional.

Uma opção mais eficiente para geração de Dumps em JVMs com Heaps grandes (>= 2gb)

Utilizar o jmap em heap muito grandes pode demorar horas para concluir. Em algumas situações é necessário reiniciar o serviço imediatamente após a falha para diminuir o tempo em que ele fica fora do ar. Uma excelente alternativa é descrita nesse artigo disponível no Blog da Atlassian: So you want your JVM’s heap…

Gerando dumps da JVM em tempo de runtime manualmente

O formato binário pode ser aberto com as ferramentas: jstack (JDK), jVisualVM (JDK), Eclipse MAT ou qualquer outro profiler Java que reconheça o formato HPROF.

jmap -dump:live,format=b,file=jvm_heap.bin <PID>

O formato texto pode ser aberto com as ferramentas: jVisualVM (JDK), IBM Thread Analizer ou qualquer outro profiler Java que reconheça dump de threads Java.

jstack -F -l <PID> > /tmp/jvm_thread.dump

NOTA: os procedimentos acima causam o travamento das threads (equivalente ao efeito Stop The World do FullGC). Portanto utilize com cautela em ambiente de produção!

A análise dos dumps citados neste post é assunto para um novo post. Existem várias ferramentas que podem ser utilizadas na análise. Além das ferramentas é importante ter conhecimento da arquitertura da Máquina Virtual Java utilizada. No caso do dump de memória (heap) é importante conhecer a divisão geracional dos pools de memória da JVM , bem como os vários mecanismos de coleta de lixo. Para o dump de threads é importante conhecer um pouco sobre a execução de threads na plataforma Java: sincronização, pilha de execução, thread monitor, thread status (WAINTING, RUNNING, BLOCKED, etc). Com a ferramenta certa e com um pouco de paciência é possível chegar a tão desejada causa raiz do problema: nome da classe, nome do método, nome da biblioteca ou até mesmo a linha de código que causa ou influência o crash do processo Java.

Dicas, JBoss

Configuração de Portas no JBoss AS 5 (Binding Service)

Serviço de Gerenciamento de Portas

O JBoss AS gerencia o mapeamento de portas utilizadas pelos diversos serviços do servidor através do mecanismo conhecido por Ports Bind.
Esse serviço é configurado no arquivo localizado em

JBOSS_HOME/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml

E possui o seguinte esquema:

  •  definição do bean ServiceBindingManagementObject que possui o conjunto de portas prédefinido no JBossAS.
 <bean name="ServiceBindingManagementObject"
       class="org.jboss.services.binding.managed.ServiceBindingManagementObject">
  <constructor>
   <parameter>${jboss.service.binding.set:ports-default}</parameter>
   <parameter>
    <set>
     <inject bean="PortsDefaultBindings"/>
     <inject bean="Ports01Bindings"/>
     <inject bean="Ports02Bindings"/>
     <inject bean="Ports03Bindings"/>
    </set>
   </parameter>
   <parameter><inject bean="StandardBindings"/></parameter>
  </constructor>
 </bean>
  • definição do conjunto de portas definidos no bean anterior
 <bean name="PortsDefaultBindings" class="org.jboss.services.binding.impl.ServiceBindingSet">
  <constructor>
   <parameter>ports-default</parameter>
   <parameter>${jboss.bind.address}</parameter>
   <parameter>0</parameter>
   <parameter><null/></parameter>
  </constructor>
 </bean>

Observe que, por padrão, o JBossAS fornece quatro conjunto de portas: PortsDefaultBindings, Ports01Bindings, Ports02Bindings e Ports03Bindings‘.

O que diferencia cada conjunto é o incremento aplicado a cada porta aberta pelos diversos serviços do JBoss. Por exemplo, o Ports01Bindings (ports-01) adiciona 100 ao valor da porta usada pelo conector http do JBoss Web, que por padrão é 8080, mas neste caso (usando o conjunto ports-01) passará a ser 8180.

Caso haja a necessidade de subir mais que quatro instâncias em um mesmo servidor utilizando o mecanismo de Ports Bind, será necessário definir novos conjuntos de portas (ex. Ports04Bindings, Ports05Bindings etc). Porém, é mais conveniente definir um conjunto de portas dinâmico. Dessa forma seu valor de incremento (padrão 100) pode ser parametrizado durante o statup do JBoss. Para isso precisamos fazer duas alterações no arquivo bindings-jboss-beans.xml.

  •  injetar um novo bean que define o conjuto de portas dinâmico/genérico.

Chamaremos esse novo bean de PortsDynaBindings.

<bean name="ServiceBindingManagementObject"
      class="org.jboss.services.binding.managed.ServiceBindingManagementObject">
 <constructor>
  <parameter>${jboss.service.binding.set:ports-default}</parameter>
  <parameter>
   <set>
    <inject bean="PortsDefaultBindings"/>
    <inject bean="Ports01Bindings"/>
    <inject bean="Ports02Bindings"/>
    <inject bean="Ports03Bindings"/>
 <inject bean="PortsDynaBindings"/>
   </set>
  </parameter>
  <parameter><inject bean="StandardBindings"/></parameter>
 </constructor>
</bean>
  •  definir o bean PortsDynaBindings.

Para isso basta copiar a definição do bloco PortsDefaultBindings as propriedades conforme destacado abaixo.

 <bean name="PortsDynaBindings" class="org.jboss.services.binding.impl.ServiceBindingSet">
  <constructor>
   <parameter>ports-dyna</parameter>
   <parameter>${jboss.bind.address}</parameter>
   <parameter>${jboss.bind.offset}</parameter>
   <parameter><null/></parameter>
  </constructor>
 </bean>

Agora para usar esse novo esquema basta informar no arquivo de parâmetros da JVM da instância (run.conf) ou no script de inicialização do JBoss o nome do novo conjunto de portas, bem como a propriedade jboss.bind.offset. Veja como fica no arquivo run.conf:

JAVA_OPTS=$JAVA_OPTS -Djboss.service.binding.set=ports-dyna
JAVA_OPTS=$JAVA_OPTS -Djboss.bind.offset=400

Esses parâmetros podem ser informados direto na linha de comando que inicia o JBoss:

JBOSS_HOME/bin/run.sh -c default -b 0.0.0.0 -Djboss.service.binding.set=ports-dyna -Djboss.bind.offset=400

Dessa forma o JBoss fará o bind das portas incrementando o valor 400 ao valor padrão definido para cada serviço. Por exemplo, o JBoss Web estará acessível através da porta 8480.

Para subir novas intâncias basta alterar o valor do parâmetro jboss.bind.offset