Merge pull request #160 from zeotuan/ci-update

- Run Test on Pull Request - Separate native(unsafe) API into different project
mrpowers-io · Oct 5, 2024 · f06904f · f06904f
2 parents c59d416 + abdf0b2
commit f06904f
Show file tree

Hide file tree

Showing 75 changed files with 213 additions and 135 deletions.
diff --git a/.github/workflows/core-ci.yml b/.github/workflows/core-ci.yml
@@ -0,0 +1,22 @@
+name: core-ci
+
+on:
+  push:
+    branches:
+    - main
+  pull_request:
+
+jobs:
+  build:
+    strategy:
+      fail-fast: false
+      matrix:
+        spark: ["3.0.1", "3.1.3", "3.2.4", "3.3.4"]
+    runs-on: ubuntu-latest
+    steps:
+      - uses: actions/checkout@v1
+      - uses: olafurpg/setup-scala@v10
+      - name: Test
+        run: sbt -Dspark.testVersion=${{ matrix.spark }} +"project core" test
+      - name: Code Quality
+        run: sbt "project core" scalafmtCheckAll
diff --git a/.github/workflows/ci.yml → .github/workflows/unsafe-ci.yml b/.github/workflows/ci.yml → .github/workflows/unsafe-ci.yml
@@ -1,22 +1,22 @@
-name: ci
+name: unsafe-ci
 
 on:
   push:
     branches:
     - main
+  pull_request:
 
 jobs:
   build:
     strategy:
       fail-fast: false
       matrix:
-        scala: ["2.12.12"]
-        spark: ["3.0.1"]
+        spark: ["3.2.4", "3.3.4"]
     runs-on: ubuntu-latest
     steps:
       - uses: actions/checkout@v1
       - uses: olafurpg/setup-scala@v10
       - name: Test
-        run: sbt -Dspark.testVersion=${{ matrix.spark }} ++${{ matrix.scala }} test
+        run: sbt -Dspark.testVersion=${{ matrix.spark }} +"project unsafe" test
       - name: Code Quality
-        run: sbt scalafmtCheckAll
+        run: sbt "project unsafe" scalafmtCheckAll
diff --git a/.scalafmt.conf b/.scalafmt.conf
@@ -1,5 +1,5 @@
 version = 2.6.3
-
+lineEndings = preserve
 align = more
 maxColumn = 150
 docstrings = JavaDoc
diff --git a/build.sbt b/build.sbt
@@ -4,27 +4,62 @@ organization := "com.github.mrpowers"
 name := "spark-daria"
 
 version := "1.2.3"
+
 crossScalaVersions := Seq("2.12.15", "2.13.8")
 scalaVersion := "2.12.15"
 
-val sparkVersion = "3.2.1"
+val versionRegex = """^(.*)\.(.*)\.(.*)$""".r
+
+val scala2_13 = "2.13.14"
+val scala2_12 = "2.12.20"
+
+val sparkVersion = System.getProperty("spark.testVersion", "3.3.4")
+crossScalaVersions := {
+  sparkVersion match {
+    case versionRegex("3", m, _) if m.toInt >= 2 => Seq(scala2_12, scala2_13)
+    case versionRegex("3", _, _) => Seq(scala2_12)
+  }
+}
+
+scalaVersion := crossScalaVersions.value.head
+
+lazy val commonSettings = Seq(
+  javaOptions ++= {
+    Seq("-Xms512M", "-Xmx2048M", "-Duser.timezone=GMT") ++ (if (System.getProperty("java.version").startsWith("1.8.0"))
+      Seq("-XX:+CMSClassUnloadingEnabled")
+    else Seq.empty)
+  },
+  libraryDependencies ++= Seq(
+    "org.apache.spark"    %% "spark-sql"        % sparkVersion % "provided",
+    "org.apache.spark"    %% "spark-mllib"      % sparkVersion % "provided",
+    "com.github.mrpowers" %% "spark-fast-tests" % "1.1.0"      % "test",
+    "com.lihaoyi"         %% "utest"            % "0.7.11"     % "test",
+    "com.lihaoyi"         %% "os-lib"           % "0.8.0"      % "test"
+  ),
+)
+
+lazy val core = (project in file("core"))
+  .settings(
+    commonSettings,
+    name := "core",
+  )
+
+lazy val unsafe = (project in file("unsafe"))
+  .settings(
+    commonSettings,
+    name := "unsafe",
+  )
 
-libraryDependencies += "org.apache.spark"    %% "spark-sql"        % sparkVersion % "provided"
-libraryDependencies += "org.apache.spark"    %% "spark-mllib"      % sparkVersion % "provided"
-libraryDependencies += "com.github.mrpowers" %% "spark-fast-tests" % "1.1.0"      % "test"
-libraryDependencies += "com.lihaoyi"         %% "utest"            % "0.7.11"     % "test"
-libraryDependencies += "com.lihaoyi"         %% "os-lib"           % "0.8.0"      % "test"
 testFrameworks += new TestFramework("com.github.mrpowers.spark.daria.CustomFramework")
 
 credentials += Credentials(Path.userHome / ".sbt" / "sonatype_credentials")
 
 Test / fork := true
 
-javaOptions ++= Seq("-Xms512M", "-Xmx2048M", "-XX:+CMSClassUnloadingEnabled", "-Duser.timezone=GMT")
-
 licenses := Seq("MIT" -> url("http://opensource.org/licenses/MIT"))
 
 homepage := Some(url("https://github.com/MrPowers/spark-daria"))
+
 developers ++= List(
   Developer("MrPowers", "Matthew Powers", "@MrPowers", url("https://github.com/MrPowers"))
 )

diff --git a/...s/spark/daria/delta/DeltaLogHelpers.scala → ...s/spark/daria/delta/DeltaLogHelpers.scala b/...s/spark/daria/delta/DeltaLogHelpers.scala → ...s/spark/daria/delta/DeltaLogHelpers.scala
diff --git a/...hub/mrpowers/spark/daria/elt/Parser.scala → ...hub/mrpowers/spark/daria/elt/Parser.scala b/...hub/mrpowers/spark/daria/elt/Parser.scala → ...hub/mrpowers/spark/daria/elt/Parser.scala
diff --git a/...powers/spark/daria/hadoop/FsHelpers.scala → ...powers/spark/daria/hadoop/FsHelpers.scala b/...powers/spark/daria/hadoop/FsHelpers.scala → ...powers/spark/daria/hadoop/FsHelpers.scala
diff --git a/.../mrpowers/spark/daria/sql/ColumnExt.scala → .../mrpowers/spark/daria/sql/ColumnExt.scala b/.../mrpowers/spark/daria/sql/ColumnExt.scala → .../mrpowers/spark/daria/sql/ColumnExt.scala
diff --git a/...ers/spark/daria/sql/CustomTransform.scala → ...ers/spark/daria/sql/CustomTransform.scala b/...ers/spark/daria/sql/CustomTransform.scala → ...ers/spark/daria/sql/CustomTransform.scala
diff --git a/...wers/spark/daria/sql/DariaValidator.scala → ...wers/spark/daria/sql/DariaValidator.scala b/...wers/spark/daria/sql/DariaValidator.scala → ...wers/spark/daria/sql/DariaValidator.scala
diff --git a/...powers/spark/daria/sql/DariaWriters.scala → ...powers/spark/daria/sql/DariaWriters.scala b/...powers/spark/daria/sql/DariaWriters.scala → ...powers/spark/daria/sql/DariaWriters.scala
diff --git a/...k/daria/sql/DataFrameColumnsAbsence.scala → ...k/daria/sql/DataFrameColumnsAbsence.scala b/...k/daria/sql/DataFrameColumnsAbsence.scala → ...k/daria/sql/DataFrameColumnsAbsence.scala
diff --git a/...k/daria/sql/DataFrameColumnsChecker.scala → ...k/daria/sql/DataFrameColumnsChecker.scala b/...k/daria/sql/DataFrameColumnsChecker.scala → ...k/daria/sql/DataFrameColumnsChecker.scala
diff --git a/...powers/spark/daria/sql/DataFrameExt.scala → ...powers/spark/daria/sql/DataFrameExt.scala b/...powers/spark/daria/sql/DataFrameExt.scala → ...powers/spark/daria/sql/DataFrameExt.scala
diff --git a/...rs/spark/daria/sql/DataFrameHelpers.scala → ...rs/spark/daria/sql/DataFrameHelpers.scala b/...rs/spark/daria/sql/DataFrameHelpers.scala → ...rs/spark/daria/sql/DataFrameHelpers.scala
diff --git a/...rk/daria/sql/DataFrameSchemaChecker.scala → ...rk/daria/sql/DataFrameSchemaChecker.scala b/...rk/daria/sql/DataFrameSchemaChecker.scala → ...rk/daria/sql/DataFrameSchemaChecker.scala
diff --git a/.../spark/daria/sql/DataFrameValidator.scala → .../spark/daria/sql/DataFrameValidator.scala b/.../spark/daria/sql/DataFrameValidator.scala → .../spark/daria/sql/DataFrameValidator.scala
diff --git a/...owers/spark/daria/sql/EtlDefinition.scala → ...owers/spark/daria/sql/EtlDefinition.scala b/...owers/spark/daria/sql/EtlDefinition.scala → ...owers/spark/daria/sql/EtlDefinition.scala
diff --git a/...park/daria/sql/FunctionsAsColumnExt.scala → ...park/daria/sql/FunctionsAsColumnExt.scala b/...park/daria/sql/FunctionsAsColumnExt.scala → ...park/daria/sql/FunctionsAsColumnExt.scala
diff --git a/...rs/spark/daria/sql/ParquetCompactor.scala → ...rs/spark/daria/sql/ParquetCompactor.scala b/...rs/spark/daria/sql/ParquetCompactor.scala → ...rs/spark/daria/sql/ParquetCompactor.scala
diff --git a/...ers/spark/daria/sql/SparkSessionExt.scala → ...ers/spark/daria/sql/SparkSessionExt.scala b/...ers/spark/daria/sql/SparkSessionExt.scala → ...ers/spark/daria/sql/SparkSessionExt.scala
diff --git a/.../mrpowers/spark/daria/sql/functions.scala → .../mrpowers/spark/daria/sql/functions.scala b/.../mrpowers/spark/daria/sql/functions.scala → .../mrpowers/spark/daria/sql/functions.scala
diff --git a/...ers/spark/daria/sql/transformations.scala → ...ers/spark/daria/sql/transformations.scala b/...ers/spark/daria/sql/transformations.scala → ...ers/spark/daria/sql/transformations.scala
diff --git a/.../daria/sql/types/StructFieldHelpers.scala → .../daria/sql/types/StructFieldHelpers.scala b/.../daria/sql/types/StructFieldHelpers.scala → .../daria/sql/types/StructFieldHelpers.scala
diff --git a/...k/daria/sql/types/StructTypeHelpers.scala → ...k/daria/sql/types/StructTypeHelpers.scala b/...k/daria/sql/types/StructTypeHelpers.scala → ...k/daria/sql/types/StructTypeHelpers.scala
diff --git a/...s/spark/daria/sql/udafs/ArrayConcat.scala → ...s/spark/daria/sql/udafs/ArrayConcat.scala b/...s/spark/daria/sql/udafs/ArrayConcat.scala → ...s/spark/daria/sql/udafs/ArrayConcat.scala
diff --git a/...wers/spark/daria/utils/ArrayHelpers.scala → ...wers/spark/daria/utils/ArrayHelpers.scala b/...wers/spark/daria/utils/ArrayHelpers.scala → ...wers/spark/daria/utils/ArrayHelpers.scala
diff --git a/...powers/spark/daria/utils/DirHelpers.scala → ...powers/spark/daria/utils/DirHelpers.scala b/...powers/spark/daria/utils/DirHelpers.scala → ...powers/spark/daria/utils/DirHelpers.scala
diff --git a/...mrpowers/spark/daria/utils/NioUtils.scala → ...mrpowers/spark/daria/utils/NioUtils.scala b/...mrpowers/spark/daria/utils/NioUtils.scala → ...mrpowers/spark/daria/utils/NioUtils.scala
diff --git a/...powers/spark/daria/utils/RowHelpers.scala → ...powers/spark/daria/utils/RowHelpers.scala b/...powers/spark/daria/utils/RowHelpers.scala → ...powers/spark/daria/utils/RowHelpers.scala
diff --git a/.../spark/daria/utils/SchemaSafeWriter.scala → .../spark/daria/utils/SchemaSafeWriter.scala b/.../spark/daria/utils/SchemaSafeWriter.scala → .../spark/daria/utils/SchemaSafeWriter.scala
diff --git a/...ers/spark/daria/utils/StringHelpers.scala → ...ers/spark/daria/utils/StringHelpers.scala b/...ers/spark/daria/utils/StringHelpers.scala → ...ers/spark/daria/utils/StringHelpers.scala
diff --git a/src/test/resources/csvs/file1.csv → core/src/test/resources/csvs/file1.csv b/src/test/resources/csvs/file1.csv → core/src/test/resources/csvs/file1.csv
diff --git a/src/test/resources/csvs/file2.csv → core/src/test/resources/csvs/file2.csv b/src/test/resources/csvs/file2.csv → core/src/test/resources/csvs/file2.csv
diff --git a/src/test/resources/csvs/file3.csv → core/src/test/resources/csvs/file3.csv b/src/test/resources/csvs/file3.csv → core/src/test/resources/csvs/file3.csv
diff --git a/src/test/resources/log4j.properties → core/src/test/resources/log4j.properties b/src/test/resources/log4j.properties → core/src/test/resources/log4j.properties
diff --git a/src/test/resources/people.csv → core/src/test/resources/people.csv b/src/test/resources/people.csv → core/src/test/resources/people.csv
diff --git a/src/test/resources/some_data.csv → core/src/test/resources/some_data.csv b/src/test/resources/some_data.csv → core/src/test/resources/some_data.csv
diff --git a/src/test/resources/zipcodes.txt → core/src/test/resources/zipcodes.txt b/src/test/resources/zipcodes.txt → core/src/test/resources/zipcodes.txt
diff --git a/...rpowers/spark/daria/CustomFramework.scala → ...rpowers/spark/daria/CustomFramework.scala b/...rpowers/spark/daria/CustomFramework.scala → ...rpowers/spark/daria/CustomFramework.scala
diff --git a/...ark/daria/delta/DeltaLogHelpersTest.scala → ...ark/daria/delta/DeltaLogHelpersTest.scala b/...ark/daria/delta/DeltaLogHelpersTest.scala → ...ark/daria/delta/DeltaLogHelpersTest.scala
diff --git a/...owers/spark/daria/elt/StagingParser.scala → ...owers/spark/daria/elt/StagingParser.scala b/...owers/spark/daria/elt/StagingParser.scala → ...owers/spark/daria/elt/StagingParser.scala
diff --git a/...s/spark/daria/elt/StagingParserTest.scala → ...s/spark/daria/elt/StagingParserTest.scala b/...s/spark/daria/elt/StagingParserTest.scala → ...s/spark/daria/elt/StagingParserTest.scala
diff --git a/...rs/spark/daria/hadoop/FsHelpersTest.scala → ...rs/spark/daria/hadoop/FsHelpersTest.scala b/...rs/spark/daria/hadoop/FsHelpersTest.scala → ...rs/spark/daria/hadoop/FsHelpersTest.scala
diff --git a/...owers/spark/daria/sql/ColumnExtTest.scala → ...owers/spark/daria/sql/ColumnExtTest.scala b/...owers/spark/daria/sql/ColumnExtTest.scala → ...owers/spark/daria/sql/ColumnExtTest.scala
diff --git a/.../spark/daria/sql/DariaValidatorTest.scala → .../spark/daria/sql/DariaValidatorTest.scala b/.../spark/daria/sql/DariaValidatorTest.scala → .../spark/daria/sql/DariaValidatorTest.scala
diff --git a/...rs/spark/daria/sql/DariaWritersTest.scala → ...rs/spark/daria/sql/DariaWritersTest.scala b/...rs/spark/daria/sql/DariaWritersTest.scala → ...rs/spark/daria/sql/DariaWritersTest.scala
diff --git a/...ria/sql/DataFrameColumnsAbsenceTest.scala → ...ria/sql/DataFrameColumnsAbsenceTest.scala b/...ria/sql/DataFrameColumnsAbsenceTest.scala → ...ria/sql/DataFrameColumnsAbsenceTest.scala
diff --git a/...ria/sql/DataFrameColumnsCheckerTest.scala → ...ria/sql/DataFrameColumnsCheckerTest.scala b/...ria/sql/DataFrameColumnsCheckerTest.scala → ...ria/sql/DataFrameColumnsCheckerTest.scala
diff --git a/...rs/spark/daria/sql/DataFrameExtTest.scala → ...rs/spark/daria/sql/DataFrameExtTest.scala b/...rs/spark/daria/sql/DataFrameExtTest.scala → ...rs/spark/daria/sql/DataFrameExtTest.scala
diff --git a/...park/daria/sql/DataFrameHelpersTest.scala → ...park/daria/sql/DataFrameHelpersTest.scala b/...park/daria/sql/DataFrameHelpersTest.scala → ...park/daria/sql/DataFrameHelpersTest.scala
diff --git a/...aria/sql/DataFrameSchemaCheckerTest.scala → ...aria/sql/DataFrameSchemaCheckerTest.scala b/...aria/sql/DataFrameSchemaCheckerTest.scala → ...aria/sql/DataFrameSchemaCheckerTest.scala
diff --git a/...rk/daria/sql/DataFrameValidatorTest.scala → ...rk/daria/sql/DataFrameValidatorTest.scala b/...rk/daria/sql/DataFrameValidatorTest.scala → ...rk/daria/sql/DataFrameValidatorTest.scala
diff --git a/...s/spark/daria/sql/EtlDefinitionTest.scala → ...s/spark/daria/sql/EtlDefinitionTest.scala b/...s/spark/daria/sql/EtlDefinitionTest.scala → ...s/spark/daria/sql/EtlDefinitionTest.scala
diff --git a/...mrpowers/spark/daria/sql/EtlHelpers.scala → ...mrpowers/spark/daria/sql/EtlHelpers.scala b/...mrpowers/spark/daria/sql/EtlHelpers.scala → ...mrpowers/spark/daria/sql/EtlHelpers.scala
diff --git a/...s/spark/daria/sql/ExampleTransforms.scala → ...s/spark/daria/sql/ExampleTransforms.scala b/...s/spark/daria/sql/ExampleTransforms.scala → ...s/spark/daria/sql/ExampleTransforms.scala
diff --git a/.../daria/sql/FunctionsAsColumnExtTest.scala → .../daria/sql/FunctionsAsColumnExtTest.scala b/.../daria/sql/FunctionsAsColumnExtTest.scala → .../daria/sql/FunctionsAsColumnExtTest.scala
diff --git a/...owers/spark/daria/sql/FunctionsTest.scala → ...owers/spark/daria/sql/FunctionsTest.scala b/...owers/spark/daria/sql/FunctionsTest.scala → ...owers/spark/daria/sql/FunctionsTest.scala
diff --git a/...park/daria/sql/ParquetCompactorTest.scala → ...park/daria/sql/ParquetCompactorTest.scala b/...park/daria/sql/ParquetCompactorTest.scala → ...park/daria/sql/ParquetCompactorTest.scala
diff --git a/...spark/daria/sql/SparkSessionExtTest.scala → ...spark/daria/sql/SparkSessionExtTest.scala b/...spark/daria/sql/SparkSessionExtTest.scala → ...spark/daria/sql/SparkSessionExtTest.scala
diff --git a/...k/daria/sql/SparkSessionTestWrapper.scala → ...k/daria/sql/SparkSessionTestWrapper.scala b/...k/daria/sql/SparkSessionTestWrapper.scala → ...k/daria/sql/SparkSessionTestWrapper.scala
@@ -5,7 +5,7 @@ import org.apache.spark.sql.SparkSession
 trait SparkSessionTestWrapper {
 
   lazy val spark: SparkSession = {
-    SparkSession
+    val session = SparkSession
       .builder()
       .master("local")
       .appName("spark session")
@@ -14,6 +14,8 @@ trait SparkSessionTestWrapper {
         "1"
       )
       .getOrCreate()
+    session.sparkContext.setLogLevel("ERROR")
+    session
   }
 
 }
diff --git a/...spark/daria/sql/TransformationsTest.scala → ...spark/daria/sql/TransformationsTest.scala b/...spark/daria/sql/TransformationsTest.scala → ...spark/daria/sql/TransformationsTest.scala
@@ -1047,22 +1047,6 @@ object TransformationsTest extends TestSuite with DataFrameComparer with ColumnC
     }
 
     'withParquetCompatibleColumnNames - {
-      "blows up if the column name is invalid for Parquet" - {
-        val df = spark
-          .createDF(
-            List(
-              ("pablo")
-            ),
-            List(
-              ("Column That {Will} Break\t;", StringType, true)
-            )
-          )
-        val path = new java.io.File("./tmp/blowup/example").getCanonicalPath
-        val e = intercept[org.apache.spark.sql.AnalysisException] {
-          df.write.parquet(path)
-        }
-      }
-
       "converts column names to be Parquet compatible" - {
         val actualDF = spark
           .createDF(

diff --git a/...ia/sql/types/StructFieldHelpersTest.scala → ...ia/sql/types/StructFieldHelpersTest.scala b/...ia/sql/types/StructFieldHelpersTest.scala → ...ia/sql/types/StructFieldHelpersTest.scala
diff --git a/...ria/sql/types/StructTypeHelpersTest.scala → ...ria/sql/types/StructTypeHelpersTest.scala b/...ria/sql/types/StructTypeHelpersTest.scala → ...ria/sql/types/StructTypeHelpersTest.scala
diff --git a/...ark/daria/sql/udafs/ArrayConcatTest.scala → ...ark/daria/sql/udafs/ArrayConcatTest.scala b/...ark/daria/sql/udafs/ArrayConcatTest.scala → ...ark/daria/sql/udafs/ArrayConcatTest.scala
diff --git a/.../spark/daria/utils/ArrayHelpersTest.scala → .../spark/daria/utils/ArrayHelpersTest.scala b/.../spark/daria/utils/ArrayHelpersTest.scala → .../spark/daria/utils/ArrayHelpersTest.scala
diff --git a/...rs/spark/daria/utils/RowHelpersTest.scala → ...rs/spark/daria/utils/RowHelpersTest.scala b/...rs/spark/daria/utils/RowHelpersTest.scala → ...rs/spark/daria/utils/RowHelpersTest.scala
diff --git a/...rk/daria/utils/SchemaSafeWriterTest.scala → ...rk/daria/utils/SchemaSafeWriterTest.scala b/...rk/daria/utils/SchemaSafeWriterTest.scala → ...rk/daria/utils/SchemaSafeWriterTest.scala
diff --git a/...spark/daria/utils/StringHelpersTest.scala → ...spark/daria/utils/StringHelpersTest.scala b/...spark/daria/utils/StringHelpersTest.scala → ...spark/daria/utils/StringHelpersTest.scala
diff --git a/src/main/scala/org/apache/spark/sql/catalyst/expressions/RandGamma.scala b/src/main/scala/org/apache/spark/sql/catalyst/expressions/RandGamma.scala
diff --git a/unsafe/src/main/scala/org/apache/spark/sql/catalyst/expressions/RandGamma.scala b/unsafe/src/main/scala/org/apache/spark/sql/catalyst/expressions/RandGamma.scala
@@ -0,0 +1,96 @@
+package org.apache.spark.sql.catalyst.expressions
+
+import org.apache.commons.math3.distribution.GammaDistribution
+import org.apache.spark.sql.catalyst.InternalRow
+import org.apache.spark.sql.catalyst.expressions.RandGamma.defaultSeedExpression
+import org.apache.spark.sql.catalyst.expressions.codegen.FalseLiteral
+import org.apache.spark.sql.catalyst.expressions.codegen.Block.BlockHelper
+import org.apache.spark.sql.catalyst.expressions.codegen.{CodeGenerator, CodegenContext, ExprCode}
+import org.apache.spark.sql.types._
+import org.apache.spark.util.Utils
+import org.apache.spark.util.random.XORShiftRandomAdapted
+
+import scala.util.{Success, Try}
+
+case class RandGamma(child: Expression, shape: Expression, scale: Expression, hideSeed: Boolean = false)
+    extends TernaryExpression
+    with ExpectsInputTypes
+    with Stateful
+    with ExpressionWithRandomSeed {
+
+  def seedExpression: Expression = child
+
+  @transient protected lazy val seed: Long = seedExpression match {
+    case e if e.dataType == IntegerType => e.eval().asInstanceOf[Int]
+    case e if e.dataType == LongType    => e.eval().asInstanceOf[Long]
+  }
+
+  @transient protected lazy val shapeVal: Double = shape.dataType match {
+    case IntegerType            => shape.eval().asInstanceOf[Int]
+    case LongType               => shape.eval().asInstanceOf[Long]
+    case FloatType | DoubleType => shape.eval().asInstanceOf[Double]
+  }
+
+  @transient protected lazy val scaleVal: Double = scale.dataType match {
+    case IntegerType            => scale.eval().asInstanceOf[Int]
+    case LongType               => scale.eval().asInstanceOf[Long]
+    case FloatType | DoubleType => scale.eval().asInstanceOf[Double]
+  }
+
+  @transient private var distribution: GammaDistribution = _
+
+  protected def initializeInternal(partitionIndex: Int): Unit = {
+    distribution = new GammaDistribution(new XORShiftRandomAdapted(seed + partitionIndex), shapeVal, scaleVal)
+  }
+
+  def this() = this(defaultSeedExpression, Literal(1.0, DoubleType), Literal(1.0, DoubleType), true)
+
+  def this(child: Expression, shape: Expression, scale: Expression) = this(child, shape, scale, false)
+
+  def withNewSeed(seed: Long): RandGamma = RandGamma(Literal(seed, LongType), shape, scale, hideSeed)
+
+  protected def evalInternal(input: InternalRow): Double = distribution.sample()
+
+  def doGenCode(ctx: CodegenContext, ev: ExprCode): ExprCode = {
+    val distributionClassName = classOf[GammaDistribution].getName
+    val rngClassName          = classOf[XORShiftRandomAdapted].getName
+    val disTerm               = ctx.addMutableState(distributionClassName, "distribution")
+    ctx.addPartitionInitializationStatement(
+      s"$disTerm = new $distributionClassName(new $rngClassName(${seed}L + partitionIndex), $shapeVal, $scaleVal);"
+    )
+    ev.copy(code = code"""
+      final ${CodeGenerator.javaType(dataType)} ${ev.value} = $disTerm.sample();""", isNull = FalseLiteral)
+  }
+
+  def freshCopy(): RandGamma = RandGamma(child, shape, scale, hideSeed)
+
+  override def flatArguments: Iterator[Any] = Iterator(child, shape, scale)
+
+  override def prettyName: String = "rand_gamma"
+
+  override def sql: String = s"rand_gamma(${if (hideSeed) "" else s"${child.sql}, ${shape.sql}, ${scale.sql}"})"
+
+  def inputTypes: Seq[AbstractDataType] = Seq(LongType, DoubleType, DoubleType)
+
+  def dataType: DataType = DoubleType
+
+  def first: Expression = child
+
+  def second: Expression = shape
+
+  def third: Expression = scale
+
+  protected def withNewChildrenInternal(newFirst: Expression, newSecond: Expression, newThird: Expression): Expression =
+    copy(child = newFirst, shape = newSecond, scale = newThird)
+}
+
+object RandGamma {
+  def apply(seed: Long, shape: Double, scale: Double): RandGamma =
+    RandGamma(Literal(seed, LongType), Literal(shape, DoubleType), Literal(scale, DoubleType))
+
+  def defaultSeedExpression: Expression =
+    Try(Class.forName("org.apache.spark.sql.catalyst.analysis.UnresolvedSeed")) match {
+      case Success(clazz) => clazz.getConstructor().newInstance().asInstanceOf[Expression]
+      case _              => Literal(Utils.random.nextLong(), LongType)
+    }
+}
diff --git a/...rg/apache/spark/sql/daria/functions.scala → ...rg/apache/spark/sql/daria/functions.scala b/...rg/apache/spark/sql/daria/functions.scala → ...rg/apache/spark/sql/daria/functions.scala
@@ -9,18 +9,18 @@ object functions {
   private def withExpr(expr: Expression): Column = Column(expr)
 
   def randGamma(seed: Long, shape: Double, scale: Double): Column = withExpr(RandGamma(seed, shape, scale)).alias("gamma_random")
-  def randGamma(shape: Double, scale: Double): Column = randGamma(Utils.random.nextLong, shape, scale)
-  def randGamma(): Column = randGamma(1.0, 1.0)
+  def randGamma(shape: Double, scale: Double): Column             = randGamma(Utils.random.nextLong, shape, scale)
+  def randGamma(): Column                                         = randGamma(1.0, 1.0)
 
   def randLaplace(seed: Long, mu: Double, beta: Double): Column = {
-    val mu_ = lit(mu)
+    val mu_   = lit(mu)
     val beta_ = lit(beta)
-    val u = rand(seed)
+    val u     = rand(seed)
     when(u < 0.5, mu_ + beta_ * log(lit(2) * u))
       .otherwise(mu_ - beta_ * log(lit(2) * (lit(1) - u)))
       .alias("laplace_random")
   }
 
   def randLaplace(mu: Double, beta: Double): Column = randLaplace(Utils.random.nextLong, mu, beta)
-  def randLaplace(): Column = randLaplace(0.0, 1.0)
+  def randLaplace(): Column                         = randLaplace(0.0, 1.0)
 }
diff --git a/...k/util/random/XORShiftRandomAdapted.scala → ...k/util/random/XORShiftRandomAdapted.scala b/...k/util/random/XORShiftRandomAdapted.scala → ...k/util/random/XORShiftRandomAdapted.scala
@@ -14,7 +14,7 @@ class XORShiftRandomAdapted(init: Long) extends java.util.Random(init: Long) wit
     nextSeed ^= (nextSeed >>> 35)
     nextSeed ^= (nextSeed << 4)
     seed = nextSeed
-    (nextSeed & ((1L << bits) -1)).asInstanceOf[Int]
+    (nextSeed & ((1L << bits) - 1)).asInstanceOf[Int]
   }
 
   override def setSeed(s: Long): Unit = {
@@ -29,4 +29,3 @@ class XORShiftRandomAdapted(init: Long) extends java.util.Random(init: Long) wit
     this.seed = XORShiftRandom.hashSeed(RandomGeneratorFactory.convertToLong(seed))
   }
 }
-