huogerac
1/26/2018 - 11:23 AM

regressao.py

astroid==1.5.3
certifi==2017.7.27.1
chardet==3.0.4
click==6.7
cycler==0.10.0
first==2.0.1
flake8==3.4.1
idna==2.6
isort==4.2.15
lazy-object-proxy==1.3.1
matplotlib==2.0.2
mccabe==0.6.1
numpy==1.13.1
pandas==0.20.3
pew==0.1.26
pip-tools==1.9.0
pipenv==8.0.6
pycodestyle==2.3.1
pyflakes==1.5.0
pylint==1.7.2
pyparsing==2.2.0
python-dateutil==2.6.1
pythonz-bd==1.11.4
pytz==2017.2
requests==2.18.4
resumable-urlretrieve==0.1.5
scikit-learn==0.19.0
scipy==0.19.1
six==1.11.0
urllib3==1.22
wrapt==1.10.11
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from sklearn.linear_model  import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import r2_score

filmes = pd.read_csv("regressao_linear_alura.csv")

amostra = filmes.sample(n=200)
x = amostra['Investimento (em milhoes)']
y = amostra['Bilheteria (pessoas)']
#visualizacao de dados
plt.scatter(x, y)
plt.show()

filmes_investimento = filmes['Investimento (em milhoes)']
filmes_bilheteria = filmes['Bilheteria (pessoas)']

#treino, teste, treino_marcacoes, teste_marcacoes =  train_test_split(filmes_investimento, filmes_bilheteria)
treino, teste, treino_marcacoes, teste_marcacoes =  train_test_split(filmes_investimento, filmes_bilheteria, test_size=0.1)

treino = np.array(treino).reshape(len(treino), 1)
teste = np.array(teste).reshape(len(teste), 1)

modelo = LinearRegression()
modelo.fit(treino,treino_marcacoes)

#r2 = modelo.score(teste, teste_marcacoes)
# r2_score(treino, treino_marcacoes)
#print("---r2-->", r2)

zootopia = [0,0,0,0,0,0,0,0,1,1,1,0,1,145.5170642,3.451632127]
#zootopia_bilheteria = modelo.predict([zootopia]) --> nao funciona
zootopia_bilheteria = modelo.predict(145.5170642)

print("---zootopia_bilheteria-->", zootopia_bilheteria)