Atualmente, o Android é o sistema operacional móvel mais dominante no mundo, com cerca de 85% do total de dispositivos móveis (como smartphones e tablets) existentes no planeta executando o sistema operacional do Google. A Google Play Store é a maior e mais popular loja de aplicativos Android, da qual cada aplicativo tem sua própria página de informações, contendo descrição, fotos, vídeos, botão para download (instalação) do app e detalhes do seu desenvolvedor ou empresa desenvolvedora
Neste sentido, a partir de informações reunidas de aplicativos existentes na Google Play Store, tivemos dois objetivos:
- Avaliar o estado de aplicativos Android entre os anos de 2010 e 2018 presentes na Google Play Store e levantar informações a respeito de sua estrutura e distribuição frente às características dos mesmos;
- Identificar que parâmetros podem ser importantes para que um aplicativo alcance um bom número de instalações ou, ainda, como os mesmos poderiam estar envolvidos com a precificação (gratuito ou pago) de um aplicativo, através de técnicas de machine learning.
Tanto as informações relativas a visualização de dados quanto dadas por técnicas de predição poderiam ser livremente interpretadas por usuários, empreendedores, analistas de dados e empresas guiados pelas suas próprias propostas e objetivos, seja auxiliando tomadas de decisão quanto a escolha de critérios de rentabilidade ou mesmo avaliando índices de popularidade e outras características inerentes ao mercado de aplicativos. Assim sendo, para contemplar estes objetivos, nos baseamos no dataset intitulado “ Google Play Store Apps ”, que reúne informações descritivas de mais de 10.000 aplicativos divididos em 33 categorias, como jogos, entretenimento, namoro, esportes, etc, no período entre 2010 e 2018. O dataset está disponível no repertório público e online Kaggle, e possui originalmente 13 colunas, a saber:
App
- Category
- Rating
- Reviews
- Size
- Installs
- Type
- Price
- Content.Rating
- Genres
- Last.Updated
- Current.Ver
- Android.Ver
O conteúdo do dataset foi analisado por técnicas de visualização de dados e métodos estatísticos, sendo posteriormente explorado por técnicas de machine learning para a identificação de parâmetros ou padrões que determinem potencialmente um sucesso de instalações de um aplicativo ou informações quanto a sua gratuidade ou não.