stdray | А почему макросам не радуются?

xeno_by написал, что макры для скалы почти вот-вот будут готовы. А люди как-то не очень радуются. Я почитал комментарии, мне что-то не понравилось такое обсуждение.

Макросы - это признание поражения. "Наш язык оказался недостаточно хорошо, нам придется генерировать программы на нём, чтобы продолжать притворяться, что мы пишем на нём".

Во-первых, тут явно подразумевается, что кодогенерация является чем-то плохим и доказывает несостоятельность языка, как средства для написания программ. Из моего ежедневного: редактировать форму мне удобней в графическом дизайнере, просматривать схему базы данных и редактировать связи между таблицами опять же удобней в графическом представлении. По-моему, очевидно, что если существуют разные способы выполнить одну работу, то надо выбирать самый удобный. И либо у нас есть серебряная пуля, либо для каждой задачи существует свой самый удобный инструмент. А чтобы это все как-то между собой взаимодействовало о совмещалось, надо приводить к одному знаменателю. Например, к текстовому представлению в виде кода на определенном языке программирования. Этот способ не единственный, но, на мой взгляд, достаточно практичный и удобный.
Во-вторых, языки развиваются и видоизменяются. При этом во время компиляции многие известные мне языки сначала рассахариваются в некоторое подмножество языковых конструкцию, после чего код на этом подможестве преобразуется в AST и поехало. Специальный синтаксис для монад (linq query syntax в C#, do-нотация в Haskell), asyc/await в C#, сахар для стрелок в том же Haskell, препроцессоры OCaml и множество других примеров. Интересно, нормально ли после каждого релиза с подобными изменениями, упрекать авторов в том, что их язык оказался недостаточно хорош?

В-третьих, существуют расширения компилятора. Для Haskell'а они активно используются и даже можно встретить мнения, что часть этих расширений пора включить в стандарт. Для C# делается некий проект Roslyn, который должен позволить пилить аналогичным образом расширения для главного языка дотнетов. На мой взгляд, это свидетельсво того факта, что разные люди по-разному видят развитие инструмента и работают в соответствующем направлении. Расширение его возможностей или наоборот специализация - это нормально. Но можно, например, заявить про признание поражения.

На мой взгляд, имеет место быть "ваша пуля не серебряная", а это как-то не серьезно.

Код с макросами очень трудно отлаживать.

Этот пойт я не понял. Я пишу на Немерле, и код с использованием макросов в отладке ни чем не отличается от кода без них. Откуда могут быть проблемы? Было выражение, потом на этапе компиляции оно раскрылось в другое выражение. И итоге получается простой линейный код с нормальными именами переменных. Проблемы - это когда стираются имена аргументов, когда стейт шарится между кучей объектов, когда стектрейс растягивается на два экрана, когда куча всего вычисляется лениво и ошибки этих вычислений экранируются и игнорируются или пихаются в стейт, когда все это вычисляется в нескольких потоках наступает ад. Макросы ничего в этот список не привносят. Есть еще отладка самих макросов, но это дело скорее неудобное чем сложное, по крайней мере, применительно к Немерле.

Практически деткам в руки дали не спички, а сразу тротиловые шашки. Представляю, что на этом могут построить наши индийские братья по разуму.

Во-первых, всем всем равно, чем занимается контингент именуемый здесь "индийские братья по разуму". Сколько лет я программирую, столько лет слышу эти рассказы, иногда вижу какие-то подтверждения. Если человек склонен к превращению кода в ад, он это сделает. Они этим занимались на Lisp, занимались на Си, занимаются на Java, будут заниматься на любом другом языке. (Я считаю, что в той или иной мере мы все к этому склонны, просто не всегда рядом есть кто-то, способный увидеть сумасшествие и указать на это, как и не всегда есть желание обсуждать подобное. А вопрос как раз и состоит в постоянном развитии и совершенствовании. И приоритеты в этом развитии могут быть разными).

Во-вторых, я не вижу, чтобы слабые программисты лезли использовать мощные и сложные средства. То есть существует некий контингент постоянно стремящийся интегрировать в проекты НОВЬЕ из последнего выпуска журнала Хакер или статей на Хабре, но там либо старшие товарищи останавливают, либо все желание пропадает, пока новатор разбирается с новой игрушкой. А те программисты, которые ничем не интересуются, пишут на небольшом примитивных подмножестве языка, мирно делаю свои велосипеды и никому жизнь портить не пытаются. (Всегда забавляет эта ежемесячная статья на Хабре "Что такое атрибуты в дотнете и зачем они нужны" и куча комментариев вроде "интересно, спасибо, прочитал") А макросы в статически типизируемом языке с негомоиконичным синтаксисом - штука сложна, очень сложная. И вроде,

xeno_by говорил, мол Мартин считает, что макросы и должны быть сложными. Может по каким-то таким причинам.

Скала очень сложная и без макросов.

- Ребята, я конфетки вам принес
- Не надо, у нас уже есть БАГЕТ. Очень сытный

То есть, я каким-то серьезных аргументов против макросов в Скале пока не увидел. Не хотят люди пользоваться - никто не заставляет. Не знают, какие задачи будут решаться макросами - но ведь никто и не спрашивает. Да и часто не читают про эти самые макросы, то у там С++, то сишка, то рефлексия тормозит.

Crossposts: http://stdray.livejournal.com/75842.html

Flat | Top-Level Comments Only

From:

golikov konstantine (from livejournal.com)

>вот начнут компилировать в нативный код

так уже же

есть scala под llvm, его конечно надо потыкать палочкой что бы убедится что оно живое, но как proof-of-concept вполне годится

From:

thesz.livejournal.com

Этого мало самого по себе. Надо, чтобы накладные расходы на значения были в районе одного слова.

А то компилирующаяся в машинный код Scala будет иметь все минусы - и большие накладные расходы, и трудности с библиотеками.

From:

sassa-nf.livejournal.com

я эту линию дискуссии не понимаю. В итоге вся скала компилируется JITом в машинный код. Беда в том, что JIT не силён в разворачивании обёрток, в которые вычисления завёрнуты.

Ленивые значения в Хаскеле как считать - одно значение в районе одного слова или это thunk в районе одного слова+одно значение?

From:

thesz.livejournal.com

Вот пример (я его уже неоднократно приводил).

http://hackage.haskell.org/packages/archive/containers/0.1.0.1/doc/html/src/Data-IntSet.html#IntSet

Значение с конструктором Tip займет два слова. Значение с конструктором Bin займёт 5 слов. Bin, как легко понять, вдвое меньше, чем Tip. В среднем, получится 3.5 слов на значение. В Java не получится лучше, чем 4,5 слов на значение.

Сколько слов займут эти два конструктора в Скале?

From:

sassa-nf.livejournal.com

А как вы расчитываете количество слов на значение в джаве?

Не вижу, почему бы скале быть в этом случае хуже, чем в джаве.

  case class IntSet;
  case class Nil extends IntSet;
  case class Tip(v:Int) extends IntSet;
  case class Bin(prefix:Int, mask:Int, left:IntSet, right:IntSet) extends IntSet;

генерирует ничего особенного:

Compiled from "a.scala"
public class a$Bin extends a$IntSet implements scala.ScalaObject,scala.Product,scala.Serializable {
  private final int prefix;

  private final int mask;

  private final a$IntSet left;

  private final a$IntSet right;
...(больше никаких полей не объявлено)
Compiled from "a.scala"
public class a$Tip extends a$IntSet implements scala.ScalaObject,scala.Product,scala.Serializable {
  private final int v;
...(больше никаких полей не объявлено)

From:

thesz.livejournal.com

http://www.javamex.com/tutorials/memory/object_memory_usage.shtml

8 байтов накладных расходов.

http://stackoverflow.com/questions/7060141/what-determines-java-object-size

И это ещё в лучшем случае!

Кстати, я неправильно посчитал расход памяти для Java для полноценного дерева. В случае Java будет 1 дополнительное слово для Bin и два дополнительных слова для Tip. Это приведёт к дополнительным расходам в 1,5 слова на значение. То есть, 5 слов супротив 3,5 на Хаскеле.

From:

sassa-nf.livejournal.com

ну, так дело не пойдёт :)

в джаве расход на object header и паддинг полей является implementation specific: IBM JVM на хедер тратит 4 байта, а хотспот 8. В количество памяти на объект также нужно учесть фрагментацию памяти, а это вообще архитектурно-зависимо. В том же хотспоте размер объекта нужно округлить вверх до кратного 8 байтам. При наследовании хотспот поля каждого уровня наследования тоже паддит. Примитивные значения сгруппированы отдельно от указателей. volatile поля выровнены до границы машинного слова. На 64-битных машинах указатели часто 32-битные, зато тратится лишние 2% ЦПУ на конвертацию обратно в 64-битные. Это всё не из-за того, что не могли сделать по-другому в принципе, а потому, что такие design decisions позволяют выиграть какие-то проценты на производительности кэша и GC.

Я думаю, гораздо более интересным сравнением будет глубина применения каких-нибудь unwrap . wrap = id оптимизаций, умение обращаться с мелкими transient объектами. Вот тут Джава может облажаться из-за трудностей escape analysis; до какой-то степени делается, но есть свои но.

From:

thesz.livejournal.com

Что это всё означает? Это означает, что в лучшем случае вы сможете получить такой же расход по памяти, как и Хаскель.

И да, pragma RULES в Скале невозможна.

From:

sassa-nf.livejournal.com

гм. я думал, это всё означает, что когда расход памяти такой же, как у Хаскеля, то это ещё не означает, что это лучший вариант даже у Хаскеля.

А ещё, я думал, это всё означает также, что расход памяти на один объект - это не так важно, как важен расход памяти на единицу бизнес логики. Как один простой пример, если уметь выбросить не нужные unwrap . wrap, которые присутствуют в коде, вы избавитесь от объектов. Второй пример - если суметь reuse место от immutable объектов до GC, опять, избавитесь от объектов.

Например, будет ясно, что тупли Скалы будут соответствовать объектам, которые Джава не сможет распаковать и потому не сможет пользоваться чисто unboxed значениями. Вот если в силу особенностей построения программы на Хаскеле компилятор может делать более глубокий анализ таких паттернов и создавать меньше объектов, чем java, это будет гораздо более ощутимой выгодой, потому что оптимизация создания одного лишнего объекта перекрывает оверхеды от разницы в размерах сразу нескольких объектов меджу этими платформами. Тем более, что чем крупнее объект, тем меньше % эта самая разница, верно?

From:

thesz.livejournal.com

>и создавать меньше объектов,

Вы про дизайн ByteString читывали ли? А ещё есть short cut deforestation. И та же pragma RULES.

From:

sassa-nf.livejournal.com

нет, не читал. А что за short cut deforestation?

заметьте, я не говорю, что кто-то круче кого-то. :) я лишь пытаюсь направить обсуждение на более интересную метрику. И привожу примеры с unwrap . wrap только потому, что это что-то, о чём я читал, но сколько из этого происходит на практике я ж не знаю :) вот в джаве - знаю, что unbox+box на бумаге-то есть, но совершенно не следует умение оптимизировать сколь угодно сложные формы boxing или сколь угодно вложенные boxing.

From:

thesz.livejournal.com

deforestation - избавление от промежуточных данных. AFAIK, полноценно возможно в ограниченных случаях. short cut deforestation - избавление от промежуточных данных в виде элементов списка.

From:

sassa-nf.livejournal.com

о, short cut deforestation нагуглился. that's what i am talking about :) вот такие вот вещи круче, чем футпринт отдельно взятых объектов.

From:

thesz.livejournal.com

Я ещё подразню.

Суперкомпиляция: http://research.microsoft.com/en-us/um/people/simonpj/papers/supercompilation/

Включает в себя inline, deforestation (насколько возможно), склеивание циклов и, наверное, многое другое.

Проверка контрактов: http://gallium.inria.fr/~naxu/research/HaskellContract.pdf

Типа проверка test_Sort = all $ (\xs -> zipWith (<=) xs (tail xs)) $ sort xs на этапе компиляции.

From:

sassa-nf.livejournal.com

о, склеивание циклов :) а я боялся спросить.

Flat | Top-Level Comments Only

S	M	T	W	T	F	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Bot Style

Никому ненужные заметки

А почему макросам не радуются?

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

(no subject)

Profile

December 2019

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags