Large refactor #1086

miguelgfierro · 2020-04-16T11:10:21Z

Description

Refactoring repo

Related Issues

#810

Checklist:

I have followed the contribution guidelines and code style for this project.
I have added tests covering my contributions.
I have updated the documentation accordingly.
This PR is being made to staging and not master.

yueguoguo

LGTM. BURN!

scenarios/COLD_START.md

miguelgfierro · 2020-05-21T14:05:31Z

TODO:

All general parts are in examples, for example when we discuss about the metrics, we link the notebook that explains them in examples folder
Finish retail.md and review again with the team

scenarios/retail/README.md

miguelgfierro · 2020-06-22T10:32:34Z

with "coordinates": "Azure:mmlspark:0.17"
notebook: examples/02_model_content_based_filtering/mmlspark_lightgbm_criteo.ipynb

pytest tests/smoke -m "smoke and spark and not gpu" --durations 0 --disable-warnings
========================================================================= short test summary info =========================================================================
FAILED tests/smoke/test_notebooks_pyspark.py::test_mmlspark_lightgbm_criteo_smoke - papermill.exceptions.PapermillExecutionError:
=================================================== 1 failed, 3 passed, 26 deselected, 53 warnings in 100.11s (0:01:40) 



    def test_mmlspark_lightgbm_criteo_smoke(notebooks):
        notebook_path = notebooks["mmlspark_lightgbm_criteo"]
        pm.execute_notebook(
            notebook_path,
            OUTPUT_NOTEBOOK,
            kernel_name=KERNEL_NAME,
>           parameters=dict(DATA_SIZE="sample", NUM_ITERATIONS=50, EARLY_STOPPING_ROUND=10),
        )

tests/smoke/test_notebooks_pyspark.py:46:
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
/anaconda/envs/reco_full/lib/python3.6/site-packages/papermill/execute.py:100: in execute_notebook
    raise_for_execution_errors(nb, output_path)
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

nb = {'cells': [{'cell_type': 'code', 'metadata': {'inputHidden': True, 'hide_input': True}, 'execution_count': None, 'sour...nd_time': '2020-06-22T10:29:38.745547', 'duration': 33.198558, 'exception': True}}, 'nbformat': 4, 'nbformat_minor': 2}
output_path = 'output.ipynb'

    def raise_for_execution_errors(nb, output_path):
        """Assigned parameters into the appropriate place in the input notebook

        Parameters
        ----------
        nb : NotebookNode
           Executable notebook object
        output_path : str
           Path to write executed notebook
        """
        error = None
        for cell in nb.cells:
            if cell.get("outputs") is None:
                continue

            for output in cell.outputs:
                if output.output_type == "error":
                    error = PapermillExecutionError(
                        exec_count=cell.execution_count,
                        source=cell.source,
                        ename=output.ename,
                        evalue=output.evalue,
                        traceback=output.traceback,
                    )
                    break

        if error:
            # Write notebook back out with the Error Message at the top of the Notebook.
            error_msg = ERROR_MESSAGE_TEMPLATE % str(error.exec_count)
            error_msg_cell = nbformat.v4.new_code_cell(
                source="%%html\n" + error_msg,
                outputs=[
                    nbformat.v4.new_output(output_type="display_data", data={"text/html": error_msg})
                ],
                metadata={"inputHidden": True, "hide_input": True},
            )
            nb.cells = [error_msg_cell] + nb.cells
            write_ipynb(nb, output_path)
>           raise error
E           papermill.exceptions.PapermillExecutionError:
E           ---------------------------------------------------------------------------
E           Exception encountered at "In [9]":
E           ---------------------------------------------------------------------------
E           Py4JJavaError                             Traceback (most recent call last)
E           <ipython-input-9-2f94d6c0254d> in <module>
E           ----> 1 model = lgbm.fit(train)
E                 2 predictions = model.transform(test)
E
E           /anaconda/envs/reco_full/lib/python3.6/site-packages/pyspark/ml/base.py in fit(self, dataset, params)
E               130                 return self.copy(params)._fit(dataset)
E               131             else:
E           --> 132                 return self._fit(dataset)
E               133         else:
E               134             raise ValueError("Params must be either a param map or a list/tuple of param maps, "
E
E           /anaconda/envs/reco_full/lib/python3.6/site-packages/pyspark/ml/wrapper.py in _fit(self, dataset)
E               293
E               294     def _fit(self, dataset):
E           --> 295         java_model = self._fit_java(dataset)
E               296         model = self._create_model(java_model)
E               297         return self._copyValues(model)
E
E           /anaconda/envs/reco_full/lib/python3.6/site-packages/pyspark/ml/wrapper.py in _fit_java(self, dataset)
E               289         :return: fitted Java model
E               290         """
E           --> 291         self._transfer_params_to_java()
E               292         return self._java_obj.fit(dataset._jdf)
E               293
E
E           /anaconda/envs/reco_full/lib/python3.6/site-packages/pyspark/ml/wrapper.py in _transfer_params_to_java(self)
E               122         for param in self.params:
E               123             if self.isSet(param):
E           --> 124                 pair = self._make_java_param_pair(param, self._paramMap[param])
E               125                 self._java_obj.set(pair)
E               126             if self.hasDefault(param):
E
E           /anaconda/envs/reco_full/lib/python3.6/site-packages/pyspark/ml/wrapper.py in _make_java_param_pair(self, param, value)
E               111         sc = SparkContext._active_spark_context
E               112         param = self._resolveParam(param)
E           --> 113         java_param = self._java_obj.getParam(param.name)
E               114         java_value = _py2java(sc, value)
E               115         return java_param.w(java_value)
E
E           /anaconda/envs/reco_full/lib/python3.6/site-packages/py4j/java_gateway.py in __call__(self, *args)
E              1255         answer = self.gateway_client.send_command(command)
E              1256         return_value = get_return_value(
E           -> 1257             answer, self.gateway_client, self.target_id, self.name)
E              1258
E              1259         for temp_arg in temp_args:
E
E           /anaconda/envs/reco_full/lib/python3.6/site-packages/pyspark/sql/utils.py in deco(*a, **kw)
E                61     def deco(*a, **kw):
E                62         try:
E           ---> 63             return f(*a, **kw)
E                64         except py4j.protocol.Py4JJavaError as e:
E                65             s = e.java_exception.toString()
E
E           /anaconda/envs/reco_full/lib/python3.6/site-packages/py4j/protocol.py in get_return_value(answer, gateway_client, target_id, name)
E               326                 raise Py4JJavaError(
E               327                     "An error occurred while calling {0}{1}{2}.\n".
E           --> 328                     format(target_id, ".", name), value)
E               329             else:
E               330                 raise Py4JError(
E
E           Py4JJavaError: An error occurred while calling o106.getParam.
E           : java.util.NoSuchElementException: Param boostFromAverage does not exist.
E               at org.apache.spark.ml.param.Params$$anonfun$getParam$2.apply(params.scala:729)
E               at org.apache.spark.ml.param.Params$$anonfun$getParam$2.apply(params.scala:729)
E               at scala.Option.getOrElse(Option.scala:121)
E               at org.apache.spark.ml.param.Params$class.getParam(params.scala:728)
E               at org.apache.spark.ml.PipelineStage.getParam(Pipeline.scala:42)
E               at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
E               at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
E               at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
E               at java.lang.reflect.Method.invoke(Method.java:498)
E               at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:244)
E               at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:357)
E               at py4j.Gateway.invoke(Gateway.java:282)
E               at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
E               at py4j.commands.CallCommand.execute(CallCommand.java:79)
E               at py4j.GatewayConnection.run(GatewayConnection.java:238)
E               at java.lang.Thread.run(Thread.java:748)

/anaconda/envs/reco_full/lib/python3.6/site-packages/papermill/execute.py:248: PapermillExecutionError

the error Param boostFromAverage does not exist. is weird, looking at the signature of LightGBMClassifier it has the parameter boostFromAverage=True.

Maven repository has changed from https://mvnrepository.com/artifact/Azure/mmlspark?repo=spark-packages to https://mvnrepository.com/artifact/com.microsoft.ml.spark/mmlspark. If I change "coordinates": "Azure:mmlspark:0.17" to "coordinates": "com.microsoft.ml.spark:mmlspark_2.11:0.18.1". Then I still get an error:

from mmlspark.train import ComputeModelStatistics
from mmlspark.lightgbm import LightGBMClassifier

model = lgbm.fit(train)


---------------------------------------------------------------------------
Py4JJavaError                             Traceback (most recent call last)
<ipython-input-11-2c2d97ba8c1c> in <module>
----> 1 model = lgbm.fit(train)

/anaconda/envs/reco_full/lib/python3.6/site-packages/pyspark/ml/base.py in fit(self, dataset, params)
    130                 return self.copy(params)._fit(dataset)
    131             else:
--> 132                 return self._fit(dataset)
    133         else:
    134             raise ValueError("Params must be either a param map or a list/tuple of param maps, "

/anaconda/envs/reco_full/lib/python3.6/site-packages/pyspark/ml/wrapper.py in _fit(self, dataset)
    293 
    294     def _fit(self, dataset):
--> 295         java_model = self._fit_java(dataset)
    296         model = self._create_model(java_model)
    297         return self._copyValues(model)

/anaconda/envs/reco_full/lib/python3.6/site-packages/pyspark/ml/wrapper.py in _fit_java(self, dataset)
    290         """
    291         self._transfer_params_to_java()
--> 292         return self._java_obj.fit(dataset._jdf)
    293 
    294     def _fit(self, dataset):

/anaconda/envs/reco_full/lib/python3.6/site-packages/py4j/java_gateway.py in __call__(self, *args)
   1255         answer = self.gateway_client.send_command(command)
   1256         return_value = get_return_value(
-> 1257             answer, self.gateway_client, self.target_id, self.name)
   1258 
   1259         for temp_arg in temp_args:

/anaconda/envs/reco_full/lib/python3.6/site-packages/pyspark/sql/utils.py in deco(*a, **kw)
     61     def deco(*a, **kw):
     62         try:
---> 63             return f(*a, **kw)
     64         except py4j.protocol.Py4JJavaError as e:
     65             s = e.java_exception.toString()

/anaconda/envs/reco_full/lib/python3.6/site-packages/py4j/protocol.py in get_return_value(answer, gateway_client, target_id, name)
    326                 raise Py4JJavaError(
    327                     "An error occurred while calling {0}{1}{2}.\n".
--> 328                     format(target_id, ".", name), value)
    329             else:
    330                 raise Py4JError(

Py4JJavaError: An error occurred while calling o115.fit.
: org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 6.0 failed 1 times, most recent failure: Lost task 0.0 in stage 6.0 (TID 21, localhost, executor driver): java.lang.UnsatisfiedLinkError: com.microsoft.ml.lightgbm.lightgbmlibJNI.LGBM_NetworkFree()I
	at com.microsoft.ml.lightgbm.lightgbmlibJNI.LGBM_NetworkFree(Native Method)
	at com.microsoft.ml.lightgbm.lightgbmlib.LGBM_NetworkFree(lightgbmlib.java:209)
	at com.microsoft.ml.spark.lightgbm.TrainUtils$.trainLightGBM(TrainUtils.scala:415)
	at com.microsoft.ml.spark.lightgbm.LightGBMBase$$anonfun$6.apply(LightGBMBase.scala:85)
	at com.microsoft.ml.spark.lightgbm.LightGBMBase$$anonfun$6.apply(LightGBMBase.scala:85)
	at org.apache.spark.sql.execution.MapPartitionsExec$$anonfun$5.apply(objects.scala:188)
	at org.apache.spark.sql.execution.MapPartitionsExec$$anonfun$5.apply(objects.scala:185)
	at org.apache.spark.rdd.RDD$$anonfun$mapPartitionsInternal$1$$anonfun$apply$24.apply(RDD.scala:836)

TODO: hint from @gramhagen, try to downgrade to spark 2.4.3 and try again

*SOLUTION
Have mmlspark 0.18.1 with spark 2.4.3 and pyspark 2.4.3 (spark was downloaded from https://archive.apache.org/dist/spark/spark-2.4.3/ by and added to /dsvm/tools/spark)

cs /dsvm/tools/spark
sudo wget https://archive.apache.org/dist/spark/spark-2.4.3/spark-2.4.3-bin-hadoop2.7.tgz
sudo tar -xzf spark-2.4.3-bin-hadoop2.7.tgz
sudo rm current
sudo ln -s spark-2.4.3-bin-hadoop2.7 current

yueguoguo · 2020-06-25T13:31:23Z

@miguelgfierro I will commit scenarios of "research recommendation" directly into the miguel/burn_and_destroy branch. Does it block anything?

miguelgfierro · 2020-06-25T13:38:59Z

@miguelgfierro I will commit scenarios of "research recommendation" directly into the miguel/burn_and_destroy branch. Does it block anything?

perfect

miguelgfierro added 2 commits April 16, 2020 11:47

rename and refactor 💥

c47fe4d

rename and refactor 💥

5551d4a

miguelgfierro requested review from gramhagen and yueguoguo as code owners April 16, 2020 11:10

miguelgfierro requested review from loomlike, anargyri and wutaomsft April 16, 2020 11:11

yueguoguo approved these changes Apr 16, 2020

View reviewed changes

scenarios/COLD_START.md Outdated Show resolved Hide resolved

anargyri approved these changes Apr 17, 2020

View reviewed changes

miguelgfierro added 9 commits April 27, 2020 12:37

refact

f6b0453

scenarios

6db4148

retail

485c1f1

retail

02bec05

retail

9c35983

retail

3e3756c

retail

7864b8e

comments @yueguoguo

44772c7

Merge branch 'staging' into miguel/burn_and_destroy

d79f878

miguelgfierro added 5 commits May 28, 2020 14:16

Merge branch 'staging' into miguel/burn_and_destroy

c6c20c5

advance

5db328f

advance

8eb19fa

advance

f3ddcae

review

f01dcb6

anargyri reviewed Jun 4, 2020

View reviewed changes

scenarios/retail/README.md Outdated Show resolved Hide resolved

gramhagen reviewed Jun 4, 2020

View reviewed changes

scenarios/retail/README.md Outdated Show resolved Hide resolved

miguelgfierro added 4 commits June 11, 2020 11:23

Merge branch 'staging' into miguel/burn_and_destroy

c1baf1e

scenarios

1e78d52

structure change

60d9587

glossary

7f44a9d

miguelgfierro added 6 commits June 19, 2020 11:20

fix 🐛 test lightfm

e1bbd2a

papers

9d7c661

papers

44b4843

typo

da7cdbf

fixed 🐛 with pymanopt

a6e441e

long tail

57b0c8a

miguelgfierro added 6 commits June 22, 2020 10:33

spark

c0185c1

ignore

b0f8a59

mmlspark lgb criteo

841fc49

🐛

871ef72

java8

1881066

benchmark

24b6ba9

miguelgfierro mentioned this pull request Jun 23, 2020

Qcactus/add lightgcn #1123

Merged

4 tasks

miguelgfierro added 2 commits June 23, 2020 11:19

retail

4e9263a

spark 2.4.3

16baaed

miguelgfierro requested review from yueguoguo and anargyri June 23, 2020 16:03

Update README.md

fd1eb0b

miguelgfierro added 4 commits June 25, 2020 14:45

lightgcn

a281478

fix 🐛 in readme

d4a5244

readms

845964a

update authors

d5ae933

wutaomsft approved these changes Jun 26, 2020

View reviewed changes

miguelgfierro added 2 commits June 29, 2020 13:06

merge staging

f4c1f4d

🐛

930427f

miguelgfierro merged commit c82807d into staging Jun 29, 2020

miguelgfierro deleted the miguel/burn_and_destroy branch June 29, 2020 12:15

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Large refactor #1086

Large refactor #1086

miguelgfierro commented Apr 16, 2020

yueguoguo left a comment

miguelgfierro commented May 21, 2020 •

edited

Loading

miguelgfierro commented Jun 22, 2020 •

edited

Loading

yueguoguo commented Jun 25, 2020

miguelgfierro commented Jun 25, 2020

Large refactor #1086

Large refactor #1086

Conversation

miguelgfierro commented Apr 16, 2020

Description

Related Issues

Checklist:

yueguoguo left a comment

Choose a reason for hiding this comment

miguelgfierro commented May 21, 2020 • edited Loading

miguelgfierro commented Jun 22, 2020 • edited Loading

yueguoguo commented Jun 25, 2020

miguelgfierro commented Jun 25, 2020

miguelgfierro commented May 21, 2020 •

edited

Loading

miguelgfierro commented Jun 22, 2020 •

edited

Loading