statistical-python
diff --git a/‎ya_glm/add_init_params.py‎
Lines changed: 3 additions & 2 deletions b/‎ya_glm/add_init_params.py‎
Lines changed: 3 additions & 2 deletions
diff --git a/‎ya_glm/backends/cvxpy/glm_solver.py‎
Lines changed: 29 additions & 15 deletions b/‎ya_glm/backends/cvxpy/glm_solver.py‎
Lines changed: 29 additions & 15 deletions
diff --git a/‎ya_glm/backends/scipy/__init__.py‎ ‎ya_glm/backends/quantile_lp/__init__.py‎ya_glm/backends/scipy/__init__.py renamed to ya_glm/backends/quantile_lp/__init__.py b/‎ya_glm/backends/scipy/__init__.py‎ ‎ya_glm/backends/quantile_lp/__init__.py‎ya_glm/backends/scipy/__init__.py renamed to ya_glm/backends/quantile_lp/__init__.py
diff --git a/‎ya_glm/backends/quantile_lp/cvxpy_quad_prog.py‎
Lines changed: 173 additions & 0 deletions b/‎ya_glm/backends/quantile_lp/cvxpy_quad_prog.py‎
Lines changed: 173 additions & 0 deletions
diff --git a/‎ya_glm/backends/quantile_lp/glm_solver.py‎
Lines changed: 83 additions & 0 deletions b/‎ya_glm/backends/quantile_lp/glm_solver.py‎
Lines changed: 83 additions & 0 deletions
@@ -28,7 +28,7 @@ def init_wrapper(init):
         # start with init's current parameters
         init_params = list(signature(init).parameters.values())
         init_params = init_params[1:]  # ignore self
-        init_param_names = set(p.name for p in init_params)
+        current_param_names = set(p.name for p in init_params)
 
         empty_init_params = set(['self', 'args', 'kwargs'])
 
@@ -48,7 +48,8 @@ def init_wrapper(init):
             cls_params = cls_params[1:]  # ignore self
             # ignore parameter if it was already in init
             cls_params = [p for p in cls_params
-                          if p.name not in init_param_names]
+                          if p.name not in current_param_names]
+            current_param_names.update([p.name for p in cls_params])
 
             params.extend(cls_params)
 
 
@@ -1,5 +1,6 @@
 import cvxpy as cp
 from functools import partial
+from time import time
 
 from ya_glm.utils import clip_zero
 from ya_glm.cvxpy.penalty import lasso, ridge
@@ -26,6 +27,7 @@ def solve_glm(X, y,
               zero_tol=1e-8,
               cp_kws={}):
 
+    start_time = time()
     ######################
     # objective function #
     ######################
@@ -50,10 +52,15 @@ def solve_glm(X, y,
     if coef.value is None:
         raise RuntimeError("cvxpy solvers failed")
 
-    return process_output(problem=problem, coef=coef,
-                          intercept=intercept,
-                          fit_intercept=fit_intercept,
-                          zero_tol=zero_tol)
+    coef, intercept, opt_data = \
+        process_output(problem=problem, coef=coef,
+                       intercept=intercept,
+                       fit_intercept=fit_intercept,
+                       zero_tol=zero_tol)
+
+    opt_data['runtime'] = time() - start_time
+
+    return coef, intercept, opt_data
 
 
 def solve_glm_path(fit_intercept=True, cp_kws={}, zero_tol=1e-8,
@@ -65,14 +72,18 @@ def solve_glm_path(fit_intercept=True, cp_kws={}, zero_tol=1e-8,
                                     check_decr=check_decr)
 
     # make sure we setup the right penalty
-    if 'lasso_pen' in param_path:
-        kws['lasso_pen'] = param_path['lasso_pen'][0]
-    if 'ridge_pen' in param_path:
-        kws['ridge_pen'] = param_path['ridge_pen'][0]
+    if 'lasso_pen' in param_path[0]:
+        kws['lasso_pen'] = param_path[0]['lasso_pen']
+    if 'ridge_pen' in param_path[0]:
+        kws['ridge_pen'] = param_path[0]['ridge_pen']
 
+    start_time = time()
     problem, coef, intercept, lasso_pen, ridge_pen = setup_problem(**kws)
+    pre_setup_runtime = start_time - time()
 
     for params in param_path:
+        start_time = time()
+
         if 'lasso_pen' in params:
             lasso_pen.value = params['lasso_pen']
 
@@ -90,7 +101,13 @@ def solve_glm_path(fit_intercept=True, cp_kws={}, zero_tol=1e-8,
                                  fit_intercept=fit_intercept,
                                  zero_tol=zero_tol)
 
-        # if generator:
+        fit_out = {'coef': fit_out[0],
+                   'intercept': fit_out[1],
+                   'opt_data': fit_out[2]}
+
+        fit_out['opt_data']['runtime'] = start_time - time()
+        fit_out['opt_data']['pre_setup_runtime'] = pre_setup_runtime
+
         yield fit_out, params
 
 
@@ -174,19 +191,16 @@ def objective(coef, intercept):
         def objective(coef, intercept):
             return glm_loss(X=X, y=y, coef=coef, intercept=intercept)
 
-    ###################
-    # setup variables #
-    ###################
+    ###############################
+    # setup variables and problem #
+    ###############################
 
     coef = cp.Variable(shape=X.shape[1], value=coef_init)
     if fit_intercept:
         intercept = cp.Variable(value=intercept_init)
     else:
         intercept = None
 
-    ###########################
-    # setup and solve problem #
-    ###########################
     problem = cp.Problem(cp.Minimize(objective(coef, intercept)))
 
     return problem, coef, intercept, lasso_pen, ridge_pen
 
@@ -0,0 +1,173 @@
+import cvxpy as cp
+from time import time
+
+from ya_glm.backends.fista.glm_solver import process_param_path
+from ya_glm.backends.quantile_lp.utils import get_lin_prog_data, \
+    get_coef_inter, get_quad_mat
+
+
+def solve(X, y, fit_intercept=True, quantile=0.5, sample_weights=None,
+          lasso_pen=1, ridge_pen=None,
+          lasso_weights=None, ridge_weights=None, tikhonov=None,
+          coef_init=None, intercept_init=None,
+          solver=None,
+          cp_kws={}):
+    """
+    Solves the L1 + L2 penalized quantile regression problem by formulating it as a linear quadratic program then appealing to cvxpy.
+    """
+
+    if lasso_weights is not None and lasso_pen is None:
+        lasso_pen = 1
+
+    if (ridge_weights is not None or tikhonov is not None) \
+            and ridge_pen is None:
+        ridge_pen = 1
+
+    start_time = time()
+
+    problem, var, lasso_pen, ridge_pen = \
+        setup_problem(X=X, y=y,
+                      fit_intercept=fit_intercept,
+                      quantile=quantile,
+                      sample_weights=sample_weights,
+                      lasso_pen=lasso_pen,
+                      ridge_pen=ridge_pen,
+                      lasso_weights=lasso_weights,
+                      ridge_weights=ridge_weights,
+                      tikhonov=tikhonov,
+                      coef_init=coef_init,
+                      intercept_init=intercept_init)
+
+    problem.solve(solver=solver, **cp_kws)
+    # solve_with_backups(problem=problem, variable=var, **cp_kws)
+
+    opt_data = {**problem.solver_stats.__dict__,
+                'status': problem.status,
+                'runtime': time() - start_time}
+        
+    if fit_intercept:
+        n_params = X.shape[1] + 1
+    else:
+        n_params = X.shape[1]
+
+    coef, intercept = get_coef_inter(solution=var.value,
+                                     n_params=n_params,
+                                     fit_intercept=fit_intercept)
+
+#     coef = clip_zero(coef, zero_tol=zero_tol)
+#     if fit_intercept:
+#         intercept = clip_zero(intercept, zero_tol=zero_tol)
+#     else:
+#         intercept = None
+
+    return coef, intercept, opt_data
+
+
+def solve_path(fit_intercept=True, cp_kws={}, zero_tol=1e-8,
+               lasso_pen_seq=None, ridge_pen_seq=None,
+               check_decr=True, **kws):
+
+    param_path = process_param_path(lasso_pen_seq=lasso_pen_seq,
+                                    ridge_pen_seq=ridge_pen_seq,
+                                    check_decr=check_decr)
+
+    # make sure we setup the right penalty
+    if 'lasso_pen' in param_path[0]:
+        kws['lasso_pen'] = param_path[0]['lasso_pen']
+    if 'ridge_pen' in param_path[0]:
+        kws['ridge_pen'] = param_path[0]['ridge_pen']
+
+    start_time = time()
+    problem, var, lasso_pen, ridge_pen = setup_problem(**kws)
+    pre_setup_runtime = time() - start_time
+
+    for params in param_path:
+        start_time = time()
+
+        if 'lasso_pen' in params:
+            lasso_pen.value = params['lasso_pen']
+
+        if 'ridge_pen' in params:
+            ridge_pen.value = params['ridge_pen']
+
+        problem.solve(**cp_kws)
+        # solve_with_backups(problem=problem, variable=var, **cp_kws)
+
+        if var.value is None:
+            raise RuntimeError("cvxpy solvers failed")
+
+        opt_data = {**problem.solver_stats.__dict__,
+                    'status': problem.status,
+                    'runtime': time() - start_time,
+                    'pre_setup_runtime': pre_setup_runtime}
+
+        if fit_intercept:
+            n_params = kws['X'].shape[1] + 1
+        else:
+            n_params = kws['X'].shape[1]
+
+        coef, intercept = get_coef_inter(solution=var.value,
+                                         n_params=n_params,
+                                         fit_intercept=fit_intercept)
+
+    #     coef = clip_zero(coef, zero_tol=zero_tol)
+    #     if fit_intercept:
+    #         intercept = clip_zero(intercept, zero_tol=zero_tol)
+    #     else:
+    #         intercept = None
+
+        fit_out = {'coef': coef, 'intercept': intercept, 'opt_data': opt_data}
+        yield fit_out, params
+
+
+def setup_problem(X, y, fit_intercept=True, quantile=0.5, sample_weights=None,
+                  lasso_pen=1, ridge_pen=None,
+                  lasso_weights=None, ridge_weights=None, tikhonov=None,
+                  coef_init=None, intercept_init=None):
+
+    if lasso_pen is not None:
+        lasso_pen = cp.Parameter(pos=True, value=lasso_pen)
+
+    if ridge_pen is not None:
+        ridge_pen = cp.Parameter(pos=True, value=ridge_pen)
+
+    if coef_init is not None or intercept_init is not None:
+        raise NotImplementedError("I do not think initialization works for these solvers")
+
+    ######################
+    # setup problem data #
+    ######################
+    A_eq, b_eq, lin_coef, n_params = \
+        get_lin_prog_data(X, y,
+                          fit_intercept=fit_intercept,
+                          quantile=quantile,
+                          lasso_pen=lasso_pen,
+                          sample_weights=sample_weights,
+                          lasso_weights=lasso_weights)
+
+    lin_coef = cp.hstack(lin_coef)
+
+    if ridge_pen is not None:
+        quad_mat = get_quad_mat(X=X,
+                                fit_intercept=fit_intercept,
+                                weights=ridge_weights,
+                                tikhonov=tikhonov)
+
+    n_dim = A_eq.shape[1]
+    var = cp.Variable(shape=n_dim)
+
+    ####################
+    # setup cp problem #
+    ####################
+    if ridge_pen is None:
+        objective = cp.Minimize(var.T @ lin_coef)
+    else:
+        objective = cp.Minimize(var.T @ lin_coef +
+                                0.5 * ridge_pen * cp.quad_form(var, quad_mat))
+
+    constraints = [var >= 0,
+                   A_eq @ var == b_eq]
+
+    problem = cp.Problem(objective, constraints)
+
+    return problem, var, lasso_pen, ridge_pen
@@ -0,0 +1,83 @@
+from ya_glm.backends.quantile_lp.scipy_lin_prog import solve as solve_lin_prog
+from ya_glm.backends.quantile_lp.cvxpy_quad_prog import solve as solve_quad_prog
+from ya_glm.backends.quantile_lp.cvxpy_quad_prog import solve_path
+
+
+def solve_glm(X, y,
+              loss_func='quantile',
+              loss_kws={},
+              fit_intercept=True,
+
+              lasso_pen=None,
+              lasso_weights=None,
+
+              ridge_pen=None,
+              ridge_weights=None,
+              tikhonov=None,
+
+              coef_init=None,
+              intercept_init=None,
+
+              solver='default',
+              solver_kws={}
+              ):
+    """
+    Solves quantile regression with either a Linear Programming (LP) formulation (for unpenalizer or Lasso penalties) or a Quadratic Programming (QP) formulation (for ridge penalties). For LPs we uses scipy's linprog solver. For QPs we use cvxpy.
+
+
+
+    """
+    if loss_func != 'quantile':
+        raise NotImplementedError("This solver only works for quantile regression")
+
+    if coef_init is not None or intercept_init is not None:
+        raise NotImplementedError("I do not think initialization works for these solvers")
+
+    if lasso_weights is not None and lasso_pen is None:
+        lasso_pen = 1
+
+    if (ridge_weights is not None or tikhonov is not None) \
+            and ridge_pen is None:
+        ridge_pen = 1
+
+    quantile = loss_kws['quantile']
+
+    kws = {'X': X,
+           'y': y,
+           'fit_intercept': fit_intercept,
+           'quantile': quantile,
+           'lasso_pen': lasso_pen,
+           'lasso_weights': lasso_weights,
+           # 'sample_weights': None,  # TODO: add
+           **solver_kws}
+
+    if ridge_pen is None:
+        if solver == 'default':
+            solver = 'highs'
+
+        return solve_lin_prog(solver=solver,
+                              **kws)
+
+    else:
+        if solver == 'default':
+            solver = 'ECOS'
+
+        return solve_quad_prog(**kws,
+                               ridge_pen=ridge_pen,
+                               ridge_weights=ridge_weights,
+                               tikhonov=tikhonov,
+                               solver=solver,
+                               cp_kws=solver_kws)
+
+
+def solve_glm_path(loss_func='quantile',
+                   loss_kws={}, **kws):
+    """
+    Path algorithm for the Linear and Quadratic Program formulations of quantile regression solved using cvxpy. This is not a true path algorithm in the sense that (I believe) the solution is not reused. However this does save time by resuing the solver setups.
+    """
+
+    if loss_func != 'quantile':
+        raise NotImplementedError("This solver only works for quantile regression")
+
+    quantile = loss_kws.pop('quantile', 0.5)
+    return solve_path(loss_func=loss_func, quantile=quantile, **kws)