pytorch · vanbasten23 · Sep 15, 2022 · Sep 13, 2022 · Sep 13, 2022 · Sep 13, 2022
diff --git a/test/cpp/test_aten_xla_tensor.cpp b/test/cpp/test_aten_xla_tensor.cpp
@@ -5839,6 +5839,17 @@ TEST_F(AtenXlaTensorTest, TestHardshrink) {
   });
 }
 
+TEST_F(AtenXlaTensorTest, TestHardshrinkWithNegativeLambda) {
+  torch::Tensor input = torch::randn({10}, torch::TensorOptions(torch::kFloat));
+  torch::Scalar lambd = -0.5;
+  torch::Tensor output = torch::hardshrink(input, lambd);
+  ForEachDevice([&](const torch::Device& device) {
+    torch::Tensor xla_input = CopyToDevice(input, device);
+    torch::Tensor xla_output = torch::hardshrink(xla_input, lambd);
+    AllClose(output, xla_output);
+  });
+}
+
 TEST_F(AtenXlaTensorTest, TestHardSigmoid) {
   torch::Tensor input = torch::randn({10}, torch::TensorOptions(torch::kFloat));
   torch::Tensor output = torch::hardsigmoid(input);

diff --git a/torch_xla/csrc/aten_xla_type.cpp b/torch_xla/csrc/aten_xla_type.cpp
@@ -1244,13 +1244,6 @@ at::Tensor XLANativeFunctions::gelu_backward(const at::Tensor& grad,
       bridge::GetXlaTensor(grad), bridge::GetXlaTensor(self), approximate));
 }
 
-at::Tensor XLANativeFunctions::hardshrink(const at::Tensor& self,
-                                          const at::Scalar& lambda) {
-  XLA_FN_COUNTER("xla::");
-  return bridge::AtenFromXlaTensor(
-      XLATensor::hardshrink(bridge::GetXlaTensor(self), lambda));
-}
-
 at::Tensor XLANativeFunctions::hardshrink_backward(const at::Tensor& grad_out,
                                                    const at::Tensor& self,
                                                    const at::Scalar& lambda) {

diff --git a/torch_xla/csrc/elementwise.cpp b/torch_xla/csrc/elementwise.cpp
@@ -69,10 +69,16 @@ xla::XlaOp BuildRelu(xla::XlaOp input) {
                              0, input_shape.element_type(), input.builder()));
 }
 
-xla::XlaOp BuildHardshrink(xla::XlaOp input, const at::Scalar& lambda) {
+xla::XlaOp BuildHardshrink(xla::XlaOp input, xla::XlaOp lambda) {
 XlaHelpers::ScalarValue(min_val, element_type, builder)); 
 XlaHelpers::ScalarValue(min_val, element_type, builder)); 
   const xla::Shape& shape = XlaHelpers::ShapeOfXlaOp(input);
-  xla::XlaOp zero = xla::Zero(input.builder(), shape.element_type());
-  return xla::Select(Between(input, -lambda, lambda), zero, input);
+  xla::PrimitiveType element_type = shape.element_type();
+  xla::XlaOp zero = xla::Zero(input.builder(), element_type);
+
+  xla::XlaOp check_low = BuildComparisonOp(at::aten::ge, input, zero - lambda);
+  xla::XlaOp check_high = BuildComparisonOp(at::aten::le, input, lambda);
+  xla::XlaOp between = xla::And(check_low, check_high);
+
+  return xla::Select(between, zero, input);
 }
 
 xla::XlaOp BuildHardSigmoid(xla::XlaOp input) {

diff --git a/torch_xla/csrc/elementwise.h b/torch_xla/csrc/elementwise.h
@@ -28,7 +28,7 @@ xla::XlaOp BuildRreluBackward(xla::XlaOp grad_output, xla::XlaOp input,
                               xla::XlaOp noise, const at::Scalar& lower,
                               const at::Scalar& upper, bool training);
 
-xla::XlaOp BuildHardshrink(xla::XlaOp input, const at::Scalar& lambda);
+xla::XlaOp BuildHardshrink(xla::XlaOp input, xla::XlaOp lambda);
 xla::XlaOp BuildHardSigmoid(xla::XlaOp input);
 xla::XlaOp BuildHardSigmoidBackward(xla::XlaOp grad_output, xla::XlaOp input);
 xla::XlaOp BuildHardSwish(xla::XlaOp input);

diff --git a/torch_xla/csrc/ops/hardshrink.cpp b/torch_xla/csrc/ops/hardshrink.cpp
diff --git a/torch_xla/csrc/ops/hardshrink.h b/torch_xla/csrc/ops/hardshrink.h
diff --git a/torch_xla/csrc/ops/ops_lower_fn.cpp b/torch_xla/csrc/ops/ops_lower_fn.cpp
@@ -330,6 +330,12 @@ torch_xla::XlaOpVector GtTensor::Lower(LoweringContext* loctx) const {
   return ReturnOp(BuildComparisonOp(at::aten::gt, xla_input, xla_other), loctx);
 }
 
+torch_xla::XlaOpVector Hardshrink::Lower(LoweringContext* loctx) const {
+  xla::XlaOp xla_input = loctx->GetOutputOp(operand(0));
+  xla::XlaOp lambd = loctx->GetOutputOp(operand(1));
+  return ReturnOp(BuildHardshrink(xla_input, lambd), loctx);
+}
+
 torch_xla::XlaOpVector Hardsigmoid::Lower(LoweringContext* loctx) const {
   xla::XlaOp xla_input = loctx->GetOutputOp(operand(0));
   return ReturnOp(BuildHardSigmoid(xla_input), loctx);

diff --git a/torch_xla/csrc/ops/ops_xla_shape_fn.cpp b/torch_xla/csrc/ops/ops_xla_shape_fn.cpp
@@ -409,6 +409,11 @@ xla::Shape GtTensorOutputShape(const torch::lazy::Value& self,
   return GtScalarOutputShape(self, other);
 }
 
+xla::Shape HardshrinkOutputShape(const torch::lazy::Value& self,
+                                 const torch::lazy::Value& lambd) {
+  return GetXlaShape(self);
+}
+
 xla::Shape HardsigmoidOutputShape(const torch::lazy::Value& input) {
   return GetXlaShape(input);
 }

diff --git a/torch_xla/csrc/ops/ops_xla_shape_fn.h b/torch_xla/csrc/ops/ops_xla_shape_fn.h
@@ -131,6 +131,9 @@ xla::Shape GtScalarOutputShape(const torch::lazy::Value& self,
 xla::Shape GtTensorOutputShape(const torch::lazy::Value& self,
                                const torch::lazy::Value& other);
 
+xla::Shape HardshrinkOutputShape(const torch::lazy::Value& self,
+                                 const torch::lazy::Value& lambd);
+
 xla::Shape HardsigmoidOutputShape(const torch::lazy::Value& input);
 
 xla::Shape HardsigmoidBackwardOutputShape(const torch::lazy::Value& grad_output,

diff --git a/torch_xla/csrc/tensor_methods.cpp b/torch_xla/csrc/tensor_methods.cpp
@@ -52,7 +52,6 @@
 #include "torch_xla/csrc/ops/gather.h"
 #include "torch_xla/csrc/ops/generic.h"
 #include "torch_xla/csrc/ops/get_dimensions_size.h"
-#include "torch_xla/csrc/ops/hardshrink.h"
 #include "torch_xla/csrc/ops/hardtanh_backward.h"
 #include "torch_xla/csrc/ops/index_ops.h"
 #include "torch_xla/csrc/ops/index_select.h"
@@ -1349,12 +1348,6 @@ XLATensorPtr XLATensor::le(const XLATensorPtr& input,
   return DispatchComparisonOp(at::aten::le, input, other);
 }
 
-XLATensorPtr XLATensor::hardshrink(const XLATensorPtr& input,
-                                   const at::Scalar& lambda) {
-  return input->CreateFrom(
-      torch::lazy::MakeNode<Hardshrink>(input->GetIrValue(), lambda));
-}
-
 XLATensorPtr XLATensor::hardshrink_backward(const XLATensorPtr& grad_out,
                                             const XLATensorPtr& input,
                                             const at::Scalar& lambda) {

diff --git a/xla_native_functions.yaml b/xla_native_functions.yaml
@@ -43,6 +43,7 @@ full_codegen:
   - ge.Tensor
   - gt.Scalar
   - gt.Tensor
+  - hardshrink
   - hardsigmoid
   - hardsigmoid_backward
   - hardswish
@@ -172,7 +173,6 @@ supported:
   - gather
   - gelu
   - gelu_backward
-  - hardshrink
   - hardshrink_backward
   - hardtanh
   - hardtanh_backward